發展AI前須妥善管理數據
近年AI熱潮影響各行各業,吸引企業管理層加快推動AI發展大計。然而,不少企業在制定計劃當下,才駭然發現從未妥善管理極具價值的營運數據。各類數據分散於各部門、營業地點,有些案例甚至仍使用紙本記錄,然後才亡羊補牢般制定數據管理的政策,拖累數碼轉型的步伐,讓運用營運數據改善決策的日子變得遙遙無期。
論及數據管理,不少業者想當然地想起公有雲,認為雲端服務供應商的應萬無一失。不過,今年五月,因雲端服務供應商的人為錯誤,澳洲一間著名退休基金的營運數據和客戶資料,聯同全球的備份被刪除。幸好,該退休基金有使用另一間雲端服務供應商,能取回被錯誤刪除的數據。這事故被科技業界視為應實施多雲端模式 (multi cloud) 的經典案例,證明IT管理人員需要預視各種看似天方夜譚的可能性,設計一個具有多重保障的數據管治系統。
數據日益分散為IT系統帶來挑戰
據IDC的研究,存放於公有雲的數據只有三成,企業有七成的數據散落於數據中心、內部系統和邊緣。考慮到物聯網、遙距辦公的發展趨勢,數據分散的情況會繼續發展。我們與管理層的日常交流更發現,企業現時不但希望加強數據的效率、可視性、彈性和可擴展性,更計劃配備有多個同等效用的備用系統,減輕單點故障 (Single Point of Failure) 影響。澳洲退休基金的事故出現後,類似的想法更為普及。
更值得注意是,企業出於種種原因,無計劃地將各類數據分散各處,使數據管理變得相當複雜,彼此之間的流通容易出現安全漏洞,亦造成各種IT和財政資源的浪費。這使企業無法善用自身價值不菲的優質營運數據,阻礙AI的訓練和應用進程。
妥善設計數據管理架構助轉型
數據需要分散存放以減輕的風險,但管理上卻應通盤考量。不少企業已認知到建立一套妥善設計的數據管理架構,以及集中管理分散數據平台的重要性。中央數據管理平台能實現管理自動化,減少人手操作同時最佳化公有雲、私有雲、各類IT供應商及內部系統的安排。
IT管理人員可以進一步加強系統的數據分析、網絡安全,更可以在系統各處引入雲端體驗,簡化數據管理。現時科技業界著力簡化企業在本地和公有雲環境中,管理和優化儲存、數據和工作負載的方式。因應混合雲端日漸普及,適用於AWS的HPE GreenLake Block Storage和提升HPE GreenLake for Private Cloud等以軟件定義的存儲方案,簡化雲端數據管理。軟件定義儲存產品可提供簡單、經濟高效的混合雲數據保護和災難復原功能,讓企業管理和保護分散於全球多種存儲環境。
數據管理涉及企業管治,管理層不宜輕視
妥善的數據管理不單是AI發展的先決條件,更是重要的風險管理措施,當中的缺失可以帶來重大的聲譽和財務損失。在六月,香港機場的航班顯示系統出現故障,航空公司不能透過電子途徑向旅客發送航班和行李資料,後備系統亦出現兼容的問題,更一度出現人手更新白板資料的狀況。類似情況因微軟全球系統故障,在七月再度上演。事後孔明之見是,主系統和後備系統的數據格式應統一,以便隨時切換系統。
然而,管理層和IT管理人員面對不可預知的風險時,只能事前做足萬全準備,而數據管理是基礎但常被輕視的範疇。數據管理既涉及儲存和分析海量資訊,如何取得必須數據、加強安全保障對企業日常營運亦甚為重要。未有善用、盡用散落各處的營運數據下,討論如何轉化數據為商業價值無疑於緣木求魚,在AI盛行的時代難免落後於人。
數據為AI之本
數據是企業賴以經營的「搵食工具」,是市場競爭力的核心。妥善管理數據的基礎下,我們才能進一步討論AI的應用以及數碼轉型。面對複雜而凌亂的數據,企業應尋求「怦然心動的數據整理魔法」,善用數據管理平台集中進行「數據收納」,作為推動AI發展及數碼轉型的第一步。
作者簡介:HPE香港及澳門總經理郭榮忠 (Vincent Kwok)