三個核心要素幫你應對機器學習挑戰
2016年,“機器學習”還只是被Gartner 視為一個“流行詞”,到如今,它已發展成為幾乎所有 IT 人士都在思考、探索或執行的一件事。毫無疑問,基于數據的分析和預測(機器從信息資源中學習,然后通知業務部門及其他部門并影響其行動)已經是當今迅速增長的最新、最熱門的技術領域之一。但對于那些正在進入機器學習領域的參與者來說,理想和現實之間仍無法平衡;正如每個不斷發展的新興事業一樣,基礎設施之水既能載舟,亦能覆舟。
本文引用地址:http://www.j9360.com/article/201801/375118.htm
Gartner已經確定了三種主要的最佳實踐,基礎設施和運營領導者在幫助所在組織準備應對機器學習 (ML) 和人工智能 (AI) 帶來的挑戰時,可以考慮采用這三種最佳實踐:
1. 采用模塊化訪問,實現高效的數據管道——根據 Gartner 的研究,“最終用戶表示,在典型項目中,數據準備和管理占去了將近 75% 到 85% 的機器學習管道。”建議在整個組織內執行更有效的數據清理、轉換和整合。
2. 制定高效的機器學習模型交付策略——該評論指出:“I&O 領導者可以通過訪問模型、功能和預測存儲庫來顯著加快其機器學習管道的速度。”這有助于縮小實驗級和生產級系統之間的資源差距。
3. 提供可擴展的計算基礎設施——Gartner 指出:“機器學習管道中的第二大時間密集型部分通常是模型工程設計階段。”同樣,建議采取的措施是針對需要聚集的核心參與者,將數據科學家、業務專家和軟件工程師的最佳技能結合起來,實現協作并推動“跨團隊的機器學習理念”。
如果具體情形難度相當,通常需要權衡生產時間和準確性以及提供組織范圍的機器學習策略,而且往往要橫跨包括公共、私有、數據庫、大數據生態系統、傳統數據存儲等在內的多個孤立的數據源進行。
評論