翻譯|行業資訊|編輯:況魚杰|2021-02-23 10:33:40.740|閱讀 278 次
概述:Cloudera數據平臺(CDP)通過解決所有現有和未來的分析需求,代表了現代數據架構的范式轉變。它基于CDH(Cloudera Data Hub)和HDP(Hortonworks Data Platform)技術的基礎,并提供了從Edge到AI的整體,集成的數據平臺,可幫助客戶加速復雜的數據管道并使數據資產民主化。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
Cloudera數據平臺(CDP)通過解決所有現有和未來的分析需求,代表了現代數據架構的范式轉變。它基于CDH(Cloudera Data Hub)和HDP(Hortonworks Data Platform)技術的基礎,并提供了從Edge到AI的整體,集成的數據平臺,可幫助客戶加速復雜的數據管道并使數據資產民主化。
在本篇文章中,提出了一個總體框架,該框架捕獲了CDP對技術和業務涉眾的好處。開發了這個框架,不僅可以幫助組織建立投資CDP的業務案例,還可以提供一種機制,根據特定的業務目標對分析性投資進行優先排序(例如,降低技術成本,加快有機增長計劃)。
評估框架包括四個方面:1)業務價值加速,2)技術成本降低/避免,3)基礎設施成本優化,4)運營效率。在以下各節中,我們將介紹量化這些維度中每個維度的方法。
此類別描述了CDP通過以下方式加速用例(以及由此產生的相關業務價值)部署的獨特能力:
為整個數據生命周期(數據流,數據工程,數據倉庫,操作數據庫和機器學習)中的不同用例提供一套全面的多樣化分析框架,同時通過共享數據體驗(SDX)無縫集成數據內容, 將計算和存儲分開的一層。
支持多種數據格式和類型,以豐富不同使用案例的數據資產。
通過SDX提供強大的安全性和治理框架,以支持越來越多的利用數據平臺的用戶。
不斷提高業務價值始終是特定于行業和客戶環境的。對于正在實施CDP的主要醫療保健提供者,能夠通過闡明加快無機增長計劃(例如)的上市時間的能力來證明其所帶來的價值。
對于將來的資產剝離和資產剝離,CDP公共云可在彈性和可擴展的云環境中加速數據資產和分析工作負載的分離。該優勢來自CDP的一項關鍵功能Replication Manager,該功能使用戶可以將現有的本地用例遷移到具有相同安全性和治理配置的公共云中。
對于未來的收購,兩種不同的CDP形式因素(CDP私有云和CDP公共云)將用作被收購實體所有大數據工作負載的單一著陸區,從而加快IT集成活動并確保客戶與客戶之間的技術標準化和合理化被收購實體。該優勢來自CDP的廣泛分析能力,這種能力轉化為一種獨特的能力,可以遷移CDH / HDP的早期版本或其他云數據倉庫以及所收購實體可能是舊有的本地數據倉庫中的不同大數據工作負載使用。
CDP幫助客戶減少(或完全避免)與競爭性分析解決方案結合使用的輔助技術工具的成本。這些輔助工具為企業級部署提供了“必備”功能,例如細粒度的訪問控制,工作負載可觀察性,數據抽象和數據發現。CDP公共云通過提供以下功能消除了使用這些工具的需要:
Cloudera Control Plane取代了基礎架構監視工具,該工具可用于從單個窗格監視本地部署和不同云上部署的群集
Apache Ranger(共享數據體驗的一部分– SDX)通過本地啟用列級和行級過濾以及數據屏蔽來替換數據安全工具,以部署細粒度的數據訪問策略機制
Cloudera數據目錄(SDX的一部分)替代了數據治理工具,以促進集中式數據治理(數據分類,數據搜索/沿襲,數據問題的跟蹤等)
Workload Manager(SDX的一部分)替代了大數據應用程序性能監視工具,該工具用于分析性能并對特定作業或工作負載進行故障排除(例如查詢失敗,成本超支)
最后,SDX將數據上下文從計算/存儲中分離出來,并從特定的分析框架中提取數據資產。結果,它替代了數據編排/抽象工具,這些工具試圖在點解決方案引入的異類數據孤島中實現某種程度的語義一致性,這些點解決方案具有自己的專有格式和體系結構特質
總之,CDP減少了對第三方工具的需求,這些工具會帶來大量成本,并導致具有許多依賴性的復雜技術堆棧。
基礎架構成本是在本地或公共云中部署的分析用例的總擁有成本(“ TCO”)公式中最大的成本組成部分,這是因為它們的計算復雜性。因此,對于企業數據平臺而言,重要的是,通過提供托管類型(公共云,本地或混合)和托管供應商(例如AWS,Google或Azure)方面的可選性,使用戶能夠最大程度地降低基礎架構成本因此可以在最經濟有效的地方執行用例。CDP通過支持各種形式的因素(私有,公共和混合云)和所有主要的公共云提供商來提供該功能。另外,它以動態方式提供托管可選性,即,它通過充當狀態和托管抽象層的共享數據體驗(SDX),以最小的努力實現了尺寸因素或云供應商之間的無縫過渡。尤其是,SDX使客戶端能夠:
通過使用基于使用模式和基礎結構經濟性的將本地工作負載突發到公共云,可以使用Replication Manager優化本地成本。這樣,客戶可以利用公共云的彈性來滿足高峰容量需求,從而避免本地容量擴展
通過啟用多云部署模型來優化計算和存儲云支出,該模型可幫助客戶通過針對特定用例,環境或區域選擇計算和存儲成本最低的云供應商來最大程度地降低總擁有成本
除了最大程度地減少基礎架構成本外,CDP還使組織能夠避免供應商鎖定。這種優勢不僅確立了Cloudera數據平臺的價值主張,而且不僅實現了短期成本降低目標,而且還確立了戰略性供應商多元化目標。
最后一個價值類別涵蓋了Cloudera數據平臺(CDP)在“數據生命周期”中各個階段活動的運營效率方面向技術和業務涉眾提供的實用程序。這些活動可以分為以下幾類:
最終用戶操作:CDP通過提供一個集成的技術平臺來加速數據操作(“ DataOps”)和機器學習操作(“ MLOps”),該平臺可讓數據科學家,數據工程師和BI分析師快速合成數據并與之交互,實現最終目標。端數據流水線等,而沒有集成延遲或必須處理零碎的數據孤島,這些孤島會導致操作效率低下。
安全和數據治理運營:CDP為信息安全和數據治理團隊提供了完善的安全和治理功能。這些功能簡化了安全性操作(“ SecOps”),例如管理用戶身份驗證和授權。此外,它通過共享數據體驗(SDX)提供了強大的數據管理功能,可對數據資產(例如,數據沿襲和發現)進行集中管理和可觀察性。
平臺管理:平臺管理團隊無需在集成方面(例如,建立專有的集成機制,如API),依賴管理,配置等方面就可以處理各種技術,從而受益于所有分析框架和安全/治理功能之間的本地集成,開銷等
總而言之,Cloudera數據平臺使分析環境的所有直接和間接用戶能夠最大程度地減少在非增值任務上花費的精力,并專注于最重要的事情:從數據中提取價值。
關于Cloudera
在 Cloudera,我們相信數據可以使今天的不可能,在明天成為可能。我們使人們能夠將復雜的數據轉換為清晰而可行的洞察力。Cloudera 為任何地方的任何數據從邊緣到人工智能提供企業數據云平臺服務。在開源社區不懈創新的支持下, Cloudera推動了全球最大型企業的數字化轉型歷程。了解更多,請聯系。
慧都大數據專業團隊為企業提供Cloudera大數據平臺搭建,免費業務咨詢,定制開發等完整服務,快速、輕松、低成本將任何Hadoop集群從試用階段轉移到生產階段。
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn
文章轉載自: