原創|行業資訊|編輯:陳俊吉|2016-07-11 09:54:17.000|閱讀 1069 次
概述:IBM BigInsights 是實現IBM大數據戰略的重要旗艦產品,下文將介紹剛發布的4.1版本所包含的功能和組件。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
是實現IBM大數據戰略的重要旗艦產品,下文將介紹剛發布的4.1版本所包含的功能和組件。
由兩個部分組成,分為開源部分和IBM增值部分,由此組合成5個不同的軟件包提供給市場需求不同的客戶使用。
在上圖中藍線之下的部分是IBM Open Platform with Apache Hadoop 版本,它包含了由Apache Hadoop社區發布的最新模塊。剛發布的版本包含了以下的內容:
用戶可以很方便地使用Apache Ambari 2.1來安裝部署IBM Open Platform with Apache Hadoop 4.1,服務也可選擇Apache社區支持(免費)或購買IBM原廠服務。
新版本可以運行的硬件和操作系統平臺更多了:
Red Hat Enterprise Linux 7
Red Hat Enterprise Linux 6
Red Hat Enterprise Linux 7
當然,對于將Hadoop引入到企業,IBM不僅只用到開源部分,沒有金剛鉆,不攬瓷器活!以下內容介紹IBM 對Hadoop 增值部分
金剛鉆之一 : BigSheets
企業內分析數據最常使用的工具其實是電子表格,來到大數據時代,怎能輕易放棄這么好用的工具?IBM提供BigSheets可以輕易將存在Hadoop里面的數據進行可視化展現,使用習慣也是類似電子表格方式,過濾行?透視表?合并不同表格列?然后選擇圖形展現:柱狀圖?餅圖?熱點圖?地理圖?輕松搞定!它自動變成了MR跑出結果!
BigSheets表格處理功能
餅狀圖
標記云圖
地理信息集成圖
金剛鉆之二:BigSQL
企業傳統上使用SQL語言訪問數據倉庫得到分析結果,在企業引入Hadoop架構變成了分布式存儲,并且成為潮流時,IBM也順勢將其企業級MPP的DB2數據庫引擎移植到了Hadoop平臺上,這個SQL查詢優化器引擎在國內外可是久經考驗,出色性能得到公認,目前是開源社區技術拍馬也難追的,沒有幾十年技術沉淀是學不會的!
金剛鉆之三:BigR
R語言被越來越多的應用在企業內進行數據統計和挖掘,它具備以下優點:
R 還提供了各種工具,可使用它們來將數據輕松導入軟件包以進行分析。但缺點也明顯,天生不支持在分布式的部署,因此有很多項目嘗試將R引入到Hadoop領域。IBM實現的方式就是利用Big R技術將R算法集成如Hadoop平臺內。IBM BigR的最大特色是不需重寫R程序,又充分利用的Hadoop平臺的可擴展性,還可以直接在BigSQL里面使用SQL來調用R算法!4.1版本還把SystemML-IBM Watson機器學習算法修改后也可以直接在BigR里面運行了!
金剛鉆之四:文本分析
大數據其中重要的應用就是要分析機器日志和社交媒體的數據,里面有大量的自然語言語義需要分析,IBM在海外和推特(Twitter)是合作伙伴的關系,可以輕松將其社交媒體數據放入進行分析。需要用到的重要的工具就是Text Analytics模塊,IBM提供了一個圖形化管理的工具,可以便捷地定義抓取規則。當然,里面也包含一系列預定義好的社交媒體接口,無需重復工作,可以快速開展工作。
由以上IBM給Hadoop社區增值的四大金剛鉆組合出主要的兩個付費版本:給數據分析員使用的版本就是含BigSheets和BigSQL模塊的IBM BigInsights Analyst 產品包;給數據科學家使用的版本是含四個金剛鉆的IBM BigInsights Data Scientist 產品包。
另外對于Hadoop平臺的有力補充,在IBM BigInsights Enterprise Management 包內含有另外兩個特別的模塊:GPFS-FPO分布式文件系統和Platform Symphony任務調度和多租戶管理模塊。前者是可以替代HDFS的文件系統,后者可以有力補充YRAN的一些局限性,我們將在未來的文章內詳細介紹。
看完了是否心動?IBM提供學習環境,免費下載Quick Start產品包吧,其中Quick Start產品包除了包含開源的IBM Open Platform for Apache Hadoop 外,BigSheets、BigSQL、BigR、Text Analytics功能都在里面!
下載試用鏈接:
詳情請咨詢!
客服熱線:023-66090381
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn