轉帖|行業資訊|編輯:陳俊吉|2016-06-27 09:47:35.000|閱讀 310 次
概述:Watson Analytics是IBM基于Watson認知技術構建的一個創新云分析平臺,它為用戶提供了一系列自助式的分析服務,包括數據準備、數據探索、預測、構建分析儀表盤等。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
是IBM基于Watson認知技術構建的一個創新云分析平臺,它為用戶提供了一系列自助式的分析服務,包括數據準備、數據探索、預測、構建分析儀表盤等。Watson Analytics的一項重要特點是簡單易用的基于自然語言的自助式分析,使得“人人都能做分析“,即便是不懂IT的人士。在體驗這項服務時,用戶只需要上傳數據,點擊“探索Explore”,Watson Analytics就會分析數據,用自然語言列舉出用戶可能感興趣的一系列問題。點擊其中的問題,Watson Analytics會針對該問題,展現出精美的圖表,和用戶進行交互式的分析。然后,用戶可以利用“預測Predict”功能進一步做深入分析,或者通過“組合Assemble”功能,組合一系列的分析圖表進行綜合分析。
最近,筆者試用了一下服務,雖然目前Watson Analytics的自然語言部分還不支持中文,但Watson Analytics易用、直觀的啟發式自助分析服務,還是給人留下非常深刻的印象。下面就讓我們一起體驗一下吧。
數據準備
根據社區的一篇教程,筆者使用的數據是下載自 www.happyplanetindex.org 的各國的幸福指數數據(不代表官方數據,這里純粹作為學習使用。)目前網站的數據時間大約是2010-2012年的,很多數據是根據蓋洛普Gallup等咨詢公司的問卷調查統計得到的。
數據是一個簡單的Excel表格,共11個字段,字段描述如上圖,數據中包括各個國家的HPI(Happy Planet Index)幸福指數和排名,以及一些相關數據例如人均GDP,人口,生活水平期望指數,生態足跡(Footprint gha/capita這個指標八卦幾句,指標評估人均對生態的影響,是個有趣的指標,有興趣的同學可以在網站計算自己的生態足跡。)
數據分析
數據準備好了,讓我們開始分析吧!分析前需要在上注冊一個免費的試用賬號,//watson.analytics.ibmcloud.com/。注冊登錄后,進到歡迎頁面,點擊Add,然后選擇Desktop,選擇你的Excel數據文件,選擇Upload,頁面顯示Transfer,完成后數據就緒了。
下面點擊Explore開始分析。什么?還沒有建模,還沒有設計報表格式?對不起,在Watson Analytics上真的不需要。更驚喜的是,點擊Explore后,Watson Analytics會分析Excel數據,并且通過自然語言處理,生成一系列你可能感興趣的問題(英文顯示,這里翻譯成中文易于理解),例如:
讓我們首先點擊第一個問題:各個國家的幸福年份數是多少?(What are the values of Happy Life Years by Country?) Watson Analytics 會自動識別我們數據中包含國家數據,通過世界地圖展示 :
其中,顏色越深的部分代表這個國家幸福的年份越久。好吧,這項數據顯然老牌發達國家占優勢。那么撇開歷史,活在當下的話,哪些國家更幸福?
點擊圖中的分析指標”Happy Life Years”,從下拉菜單中將指標替換“Happy Planet Index”,圖形發生了變化,現在顯示的是當下的各個國家的幸福指數:
嗯,顯然金磚四國為首的發展中國家當下更幸福。
下面我們想找出那些對幸福生活標準期望高而且現實也確實生活幸福(夢想成真)的國家,回到開始的界面,點擊另一個問題:哪些國家的幸福生活期望指數和幸福指數都比較高?(Which countries have high measurements for life expectancy and well-being?) 我們得到了下圖:
這里縱軸代表幸福感(Well-being),橫軸代表對幸福生活的期望(Life Expectancy),因此越靠近右上角的國家在兩個指標上都越高,越接近夢想成真了。這里有丹麥(Denmark),加拿大(Canada),哥斯達黎加(Costa Rica)…
慢著,為什么氣泡有大有?。吭瓉韴D里還有一個玄機,這里氣泡大小代表了另一個指標:生態足跡(Footprint),氣泡越大代表人均生態足跡越高,即對環境影響越大。光幸福還不夠,幸福不能以破壞自然環境為代價,保持可持續發展,才能持續幸福。比較一下右上限的氣泡大小,我們發現哥斯達黎加實在是人類楷模,不僅幸福指數高,而且那個氣泡比起丹麥,加拿大小了幾圈呢,說明人家對生態環境的影響還要小,給個大拇指吧!
說到幸福感(Well-being),腦中不由浮起了那首歌“幸福在哪里?”,那么幸福感和哪些因素有關呢?是財富嗎?讓我們點開這個問題:幸福指數和人均GDP關系大嗎?(What is the relationship between Well-being and GDP/capita by Country?),出現了下圖:
這里縱軸代表人均GDP,越靠上越高,橫軸代表幸福感(Well-being),越靠右越幸福。先看看右上角,丹麥,芬蘭,奧地利,比利時,還有加拿大,澳大利亞,這些國家不但富有而且幸福指數高。那么難道真的沒錢就沒幸福,還不給人窮著樂了?請看回右下角,哥斯達黎加,巴西,阿根廷這些國家,雖說人均GDP只有15K左右,離右上角那些國家的40K人均GDP差了一倍多,但是幸福指數卻差距不大。看來幸福指數并不由人均GDP決定,錢確實不是萬能的。
那么到底什么才是幸福感的主要因素呢?
這里我們就需要用到中的預測(Predict)功能了,回憶一下我們的數據,在Excel的每一行數據中都含有幸福指數,以及相關的人均GDP,人口數量,人均生態足跡等數據,我們可以建立一個預測模型,看看哪些相關變量對幸福指數影響最大。點擊預測(Predict)功能,把上述指標放進要預測的列表,然后開始預測,我們得到下圖:
這張圖對關聯指標進行了各種組合(縱軸的Sub Region),并分析了它們對幸福指數(橫軸)的影響。我們發現第一組指標對幸福感的影響是最強的。那么第一組中都有哪些因素?我們點擊最上面的橫條,具體來分析它:
在這張圖中,我們有了答案。圖中的標題顯示,原來對幸福指數貢獻最大的是生態足跡(Footprint)和幸福的年數(Happy Life Years),可信度是81%。圖中橫軸是生態足跡(Footprint),縱軸是幸福的年數(Happy Life Years),顏色越深代表幸福指數越高。對比這兩個指標,又以縱軸幸福的年數(Happy Life Years)影響更大,就是說幸福的年數越多,則繼續幸福的可能性越大。為什么?難道幸福是可以遺傳的?非也,筆者的結論是只有每一代人都努力減少生態足跡,減少對環境的破壞,保持長期可持續發展,才能造福子孫后代,世代幸福。你贊同嗎?
如果對這個結論背后的算法感興趣,可以切換一下視圖,下圖中Watson Analytics會告訴你它用的算法,由于我們需要分析的幸福指數是一個連續變量,Watson Analytics自動使用了線性回歸(Liner Regression)算法,建立了一個多階方程式來計算相關變量如人均GDP,生態足跡等因素與幸福指數之間的關系,并選擇了其中關聯性最緊密的組合。當然,這都是圖形背后的故事,Watson Analytics的強大之處在于分析人員根本不需要關注復雜的模型和算法,一切都已經自動化,用戶需要關注的只是分析結果和它的含義。
怎么樣?通過本次對分析服務的體驗,是不是對分析過程的易用性和基于自然語言的智能化引導印象深刻?通過Watson Analytics,只要有數據,點點按鈕,每個人都可以進行數據分析,而且并不需要關注高深的模型和算法。實際上,“看圖講故事”,透過精致的圖表,分析后面的業務含義,才是分析員真正的關注點,這不正是分析師們期待已久的下一代自助式分析嗎?
另外,本次體驗只使用了Watson Analytics基本的數據探索(Explore)和預測(Predict)服務,可以說只使用了Watson Analytics豐富服務的冰山一角。Watson Analytics上還提供了對數據的加工(Refine)服務,對各種分析結果進行綜合的組合(Assemble)服務,甚至可以讓Watson根據分析結果生成令人信服的故事。Watson Analytics還可以結合IBM Bluemix公有云上的服務一起使用,例如使用Bluemix的DashDB存儲更復雜更大量的數據源進行分析;進行社交數據、天氣數據、物聯網數據的分析等。目前,各行業的分析人員正在使用Watson Analytics構建自己的創新分析應用。在Watson Analytics的社區中,有些有趣的案例令人腦洞打開,例如用到Watson Analytics來挑選球員,構建自己攻守兼備的最佳陣型//community.watsonanalytics.com/dream-el-salvador-soccer-team/;
另一個案例則分析讀個本科學歷對個人工作收入、工作時間的影響:
//community.watsonanalytics.com/what-will-a-graduate-degree-give-me-exploring-the-american-time-use-survey-data-set/
筆者還有同事上傳自己的每月開銷來進行分析
有了數據,有了,分析如此簡單,人人都能成為數據分析師。不多說了,祝您圣誕快樂,一起為中國的幸福指數加分吧!
via:華南IBM大數據支持團隊
詳情請咨詢“”!
客服熱線:023-66090381
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn