原創|行業資訊|編輯:況魚杰|2020-06-02 15:39:46.577|閱讀 53 次
概述: 當您將這兩個統計數據聯系起來時,很明顯,要部署和運行模型,必須克服一系列挑戰。 本文將會介紹如何使您對這些挑戰以及如何克服這些挑戰有更深入的了解。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
2019年,Cloudera組織在機器學習應用程序開發(Statistica)中投資了285億美元。但是,只有35%的組織表示已在生產中完全部署了分析模型(IDC)。
當您將這兩個統計數據聯系起來時,很明顯,要部署和運行模型,必須克服一系列挑戰。常見的障礙通常集中在:
以下各段將使您對這些挑戰以及如何克服這些挑戰有更深入的了解。
一塊玻璃可以防碎
無論您處于機器學習開發的哪個階段,如果使用點解決方案或孤立的工具集,都將為模型和業務創建漏洞。為了克服這個問題,您需要在一個整體的,統一的平臺上進行操作,使您可以通過一個單一的窗格(從數據源到生產環境)查看操作。這將使您的團隊更快地將ML模型從實驗移至生產,并為您提供對數學和技術指標性能的精簡見解。
擁有集成的主干將幫助您可視化數據(無論是圖表,圖形還是其他可視化效果),從而使您可以評估進度并快速進行迭代。它還可以提供自動化功能–如果缺少基準或檢測到異常,則向您發送警報。
建立或破壞您的代碼
ML探索的早期步驟要求您整理原始數據源,并為進行測試和建模做好準備。當您了解數據和問題時,代碼將快速發展。如果您的數據工程和科學團隊以孤立的方式工作(使用不同的解決方案),您將不可避免地遇到一個共同的挑戰:您的生產系統將無法運行ML模型。
重寫生產代碼會大大減慢您的進度,從而浪費時間和金錢。為了克服這一(極其常見的)挑戰,您應該考慮從一開始就進入生產和跨團隊協作的樣子。即使距離這個階段還很遙遠,也請考慮一個集成平臺將為您的數據科學家和工程師長期提供的功能:在一個地方實時訪問數據和模型。
這一點與確保您利用ML操作(MLOps)標準緊密相關。盡早(在平臺的幫助下)做到這一點,以便您在團隊和生產工作流中使用共同的語言。這樣可以確保您的數據,代碼和模型的結構能夠在生產環境中正常運行,無論它們是本地還是在云中。
影子IT差距:浪費好精力的地方
無論我們是否在談論機器學習,企業中的安全性都是至關重要的。如果沒有正確的端到端基礎架構,對整個機器學習工作的挑戰(或威脅)可能變得孤立無援(影子IT)。如果您缺乏可見性并被迫對模型進行編碼和重新編碼,則會造成差距。IT漏洞是不良行為者和無盡隧道的避風港,在隧道中數據可能會丟失或混亂。您需要具有強大的端到端治理標準的統一平臺,以確保流經生產環境的數據安全。
不要讓基礎架構阻止您
部署的重點是釋放更大的業務價值-從可用的模型過渡到提供概率性預測和說明性見解的模型。
部署模型時,它們將占用大量數據和計算資源。您的基礎架構必須能夠支持這些工作負載。一個普遍的挑戰是使數據和模型在內部部署和云環境之間無縫地移動,以進行工作流,例如突發計算密集型工作,在企業內或通過Web部署模型。當您沒有靈活的環境時,幾乎不可能擴展模型。
這里的關鍵是利用提供互操作性的平臺。這將創建可以連續監視和控制的靈活工作流。設置好這些設置后,您還將有機會采用微服務,從而使您可以查看生產分析,從而幫助您快速迭代和擴展。
關于Cloudera
在 Cloudera,我們相信數據可以使今天的不可能,在明天成為可能。我們使人們能夠將復雜的數據轉換為清晰而可行的洞察力。Cloudera為任何地方的任何數據從邊緣到人工智能提供企業數據云平臺服務。在開源社區不懈創新的支持下, Cloudera推動了全球最大型企業的數字化轉型歷程。了解更多,請聯系。
歡迎撥打慧都熱線023-68661681或咨詢慧都在線客服,我們有專業的大數據團隊,為您提供免費大數據相關業務咨詢!
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn