原創|行業資訊|編輯:龔雪|2014-10-31 09:39:34.000|閱讀 374 次
概述:本文主要為大家介紹數據時代背景下的大數據。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
我們回顧數據空間的層層演變,驚嘆那些曾經令我們印象深刻的數據應用程序和工具。數據正在對企業的商業運營模式以及盈利能力產生影響。如今你已經很難找到一個簡單的程序不以顯著的方式使用數據。一部分公司使用數據分析并由此來做出一些決策,因為這樣他們得以超越同行成為業界翹楚。
直到最近,訪問大數據還是需要具備顯著的專業知識和工具。如今很多工具已經得到改善,而社區已經成為了分享這些工具的主要場所。令我們非常高興的是許多針對新的數據集和數據類型的解決方案也陸續出臺。在這樣一個跨越傳統學科數據技能的時代,企業也開始強調文化、人以及流程的重要性。
我們展望未來,思考未來的數據前景,這也是我們在這里的主題。
大數據的算法和有效用戶界面的結合,讓我們看到了許多優秀的消費者應用程序,諸如Waze和谷歌。我們對這個話感興趣源于許多領域專家和業務分析師的分析以及民主化的工具,特別地,新的視覺界面打開了許多新的數據源和數據類型。
提起這個話題的算法,我想很多討論人工智能算法的人一定很感興趣。隨著智能系統變得越來越不同,安全和隱私也成為了關鍵的部分。盡管在這個領域當中很多人提出了“不合理的有效性數據”,但是算法的創新仍然是一個非常重要的領域。
物聯網(IOT)需要系統能夠處理和釋放大量的事件數據,這些系統將從分析平臺開發監控操作。除了數據管理,目前做的最多的就是事件發展流分析和大量的時間序列分析。
分析項目中涉及的一系列步驟,往往需要不同的工具。有越來越多的公司和開源項目將各種分析工具集成到統一的用戶界面和包,將這些集成工具復制、讓它們相互協作以及將其合理的進行部署。這仍然是一個活躍的區域,作為專業工具急于將其擴大在數據管道的覆蓋率。
在大數據系統當中許多流行的組件都是開源的, 因此,許多公司通過裝配組件建立自己的基礎設施和數據產品,比如Spark,Kafka,Cassandra和ElasticSearch。對比這幾年的變化,許多企業從沒有組裝過這些組件到建立完善的技術體系,這是一個從無到有的巨大演變的過程。然而企業真正感興趣的是應用程序和分析平臺,而不是而不是單獨的組件。為此要求數據工程師們保持數據流和數據存儲的健壯性來組裝這些組件。
很顯然,數據分析師大多來自社會科學(如調查、心理測驗學)。 然而我們注意到更多的數據科學家正在擴大與產品設計師和社會科學家的合作。
“數據驅動”的組件是善于利用數據提高決策,然而這一切都始于儀器。RelateIQ副總裁DJ Patil曾經說過,“如果你不能測量它,那么你不能修復它”。 此外,分布式計算的發展在過去的十年中已經是數據產品公司的主流技術。在很多情況下,數據產品發展階段(從“最小可行產品”)是由跨職能團隊來替代分析技術。
每隔幾個月似乎有一篇文章批評炒作大數據,往深處挖掘你會發現,這些批評指出了許多有經驗數據分析師曾經分析的突出問題。 我的觀點是,隱私和模型文化是非常重要的。
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn
文章轉載自:慧都控件網