轉帖|行業資訊|編輯:龔雪|2016-04-28 11:33:40.000|閱讀 116 次
概述: 馬云曾說,“我們還沒搞懂PC互聯網的時候,移動互聯網來了。我們還沒搞懂移動互聯網的時候,大數據來了。”大數據是否被過度熱炒?現行大數據分析是否可靠?這些疑問在大數據已作為國家戰略被寫進“十三五”規劃綱要的當下迫切需要得到解答。北京大學國家發展研究院教授沈艷在接受海外網專訪時強調,在明確大數據局限性和可行性的基礎上,大數據產業才能夠扎實發展。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
馬云曾說,“我們還沒搞懂PC互聯網的時候,移動互聯網來了。我們還沒搞懂移動互聯網的時候,大數據來了。”作為近幾年來最熱門的網絡概念之一,大數據在多個領域的落地顯示出其巨大優勢,如出行類APP在城市中為用戶提供快速的車輛調度,又如谷歌智能系統阿爾法圍棋在人機圍棋大戰中獲勝。然而大數據應用喜憂參半亦是事實,曾作為大數據具備革命性潛力證明的谷歌流感趨勢近幾年的預測結果并不盡如人意。
大數據是否被過度熱炒?現行大數據分析是否可靠?這些疑問在大數據已作為國家戰略被寫進“十三五”規劃綱要的當下迫切需要得到解答。北京大學國家發展研究院教授沈艷在接受海外網專訪時強調,在明確大數據局限性和可行性的基礎上,大數據產業才能夠扎實發展。
盡管大數據的定義見仁見智,但其海量的數據規模、動態的數據體系、多樣的數據類型等是業界的共識。沈艷表示,大數據能夠以前所未有的精細度描畫世界,如運用得當,能夠幫助人們快速刻畫新舊經濟更替,給予產業發展方向以可視化指導,并為政府決策提供參考。
但是,大數據應用也面臨陷阱,沈艷表示,“有一種看法認為,有了大數據就有了總體,就不再需要科學抽樣了。”這種“大數據自大”傾向之所以值得警惕,一方面在于,數據反映的信息可能只是總體的一部分;另一方面,總體可能會在時間推移中發生變化。例如,“使用谷歌搜索流感相關信息的用戶”和“美國流感人群”這個總體并不完全重合,因此用后者預測流感趨勢存在先天不足。
陷阱的出現與大數據的收集方式息息相關。沈艷指出,傳統數據或者來自問卷調查,或者即便是經營活動留下的數據,也往往有規范標準,使得數據含義前后可比。而大數據更多是生產經營等各類活動的附屬產品,當服務于主營業務的系統架構不斷變化,數據生成規律將隨之變化。而數據分析方很可能對此全然不知或不能深刻體會,沿用以往的分析方法,就很容易產生結論的偏差。
“當新技術來臨,尤其是面對經濟新舊轉型,我們迫切需要新的增長點,很容易未經深究就相信新技術的力量。但實際上只有在清晰地知道它各種各樣局限的基礎上,我們才能去用它。”這是沈艷對當前大數據運用的看法。
對比美國大數據產業圖景(分為架構、分析、應用三部分),沈艷發現,“十三五”規劃中大數據戰略的內容集中在架構和應用部分,比如加快政府數據開放共享,進行海量數據采集、存儲、清洗、分析發掘、可視化等領域關鍵技術攻關。
她指出,應加強對大數據分析的重視,包括回歸問題本源,進行數據可行性分析等,也表示并非所有企業都有能力進行大數據分析。“數據分析具有門檻,要防止一哄而上、不管是否適合自己都要趕上潮流。”沈艷坦言,即便沒有遵循科學規范的分析方法,一些大數據產品也能夠在一定程度上解決問題,但是其商業模式是否真正可行、是否能夠持續很難確認。而且若導致重要領域出現問題,可能產生重大損失。
而目前的一大桎梏是大數據分析人才的緊缺。沈艷認為,人才培養觸及產業健康發展的核心,大數據發展亟須既懂關鍵技術又懂專業領域的跨界人才。此外,國家還需對決策者和民眾有相應的培訓投入。
采訪中,沈艷仍然對大數據前景充滿信心,她期待大數據產業幫助中國的新經濟成長起來,讓中國持續成為世界經濟的引擎。
∗本文轉載自官網。
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn