原創(chuàng)|行業(yè)資訊|編輯:陳俊吉|2017-03-21 13:25:56.000|閱讀 442 次
概述:意圖打開數(shù)據(jù)科學(xué)的大門但卻不知怎么開始?那就看一看我們整理出的10種在數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析師眼中這些熱門的語言和工具。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
意圖打開數(shù)據(jù)科學(xué)的大門但卻不知怎么開始?那就看一看我們整理出的10種在數(shù)據(jù)科學(xué)家和師眼中這些熱門的語言和工具。
R語言
R語言是數(shù)據(jù)科學(xué)家和分析師們常用的兩種頂級工具中的一種。1995年 Ross Ihaka 和 Robert Gentleman 創(chuàng)造了R語言,對數(shù)據(jù)分析和開放。R語言有活躍的使用群,因而就有了為特定問題分析所設(shè)計的語言壓縮包。
在去年(2015年)微軟已與R語言服務(wù)提供商 Revolution Analytics 達成收購協(xié)議。從微軟官方得知,促使微軟收購該公司的主要原因是:當前許多企業(yè)需要處理的數(shù)據(jù)量不斷增長,并需要更多軟件對這些數(shù)據(jù)進行分析、處理。而Revolution Analytics的主打產(chǎn)品是一款被稱作R的統(tǒng)計分析類編程語言,通過R語言能夠進一步加強微軟云計算業(yè)務(wù)。另外,Revolution Analytics表示被收購之后,他們?nèi)詫⒊掷m(xù)支持R語言的開源項目并提供給客戶訂閱式的技術(shù)支持服務(wù)。
Python
數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析師使用的另外一個頂級工具是 Python,它最早的版本出現(xiàn)在1990年,由 Guido Van Rossem 發(fā)明。如果你瀏覽程序科學(xué)家或者程序分析師的招聘啟事,會發(fā)現(xiàn)首要的技能需求就是了解 R語言、Python語言或者是經(jīng)常兩種都要求了解。在 Datacamp網(wǎng)站,Python語言是程序開發(fā)初級人員公認的最好語言,而R語言則有一條陡峭的學(xué)習(xí)曲線。
Scala
Scala語言結(jié)合了職能性要求和目標導(dǎo)向程序要求,它和Java語言、Javascript語言一并工作。因為很多公司渴望研究實時的數(shù)據(jù)資料,所以Scala是現(xiàn)如今最熱門的待學(xué)語言。Scala語言應(yīng)用在很多技術(shù)中,能夠使諸如Apache Spark和 Apache Kafka的數(shù)據(jù)流化。在某科技網(wǎng)站數(shù)據(jù)科技類薪水調(diào)查發(fā)現(xiàn)在2015年Scala語言的使用量增長了10%。
SQL
當不需要使用大量的數(shù)據(jù)時, SQL語言(結(jié)構(gòu)性詢問語言)不失為數(shù)據(jù)分析師使用的大熱語言工具,調(diào)查發(fā)現(xiàn),68%的受訪者說他們使用SQL語言。很多傳統(tǒng)企業(yè)的數(shù)據(jù)存儲方式依然是關(guān)系型數(shù)據(jù)管理系統(tǒng)例如 Oracle,MySQL,SQL Server,所以對于企業(yè)型組織來說,SQL語言依然必不可少。
Excel
讓我們一起面對它吧,即使在高水平語言輩出的年代,Excel工具仍舊被很多人所認可。調(diào)查發(fā)現(xiàn)59%的數(shù)據(jù)科學(xué)家和分析師使用 Excel 工具,這個數(shù)據(jù)幾乎年年如此,少有變化。Excel 是經(jīng)過檢驗的可靠的數(shù)據(jù)分析工具,它廣泛存在,非程序人員也能便捷操作,所以大多數(shù)企業(yè)即使也使用其他工具,但 Excel 工具還是他們的不二選擇。
SAS工具
高端分析所使用的高德納公司魔力象限研究方法中,SAS工具是領(lǐng)導(dǎo)者之一;在商業(yè)精英和分析師平臺所使用的魔力象限研究方法中,SAS是夢想家。SAS最開始發(fā)源于北卡羅來納州立大學(xué),1976年SAS的成套軟件從學(xué)校分離出來進入公司。現(xiàn)如今,在數(shù)據(jù)分析師中,SAS依舊很流行,應(yīng)用機器學(xué)習(xí)啟動的Crowedflower數(shù)據(jù)處理方式,通過從數(shù)以千計的發(fā)到linkedIn上的招聘情況分析發(fā)現(xiàn),15%-20%的工作職位要求候選者有使用SAS的經(jīng)歷。
Java
在大多數(shù)數(shù)據(jù)科學(xué)家的招聘啟事中,要求應(yīng)聘者掌握JAVA語言的需求更多,放到LinkedIn上的35%到40%的數(shù)據(jù)科學(xué)家招聘啟事中,要求職位候選者有使用Java語言的經(jīng)歷。調(diào)查表明使用Java語言的人數(shù)從2014年的32%下降到2015年的23%,不過這也表明大約四分之一的受訪者還在使用Java語言。
MatLab
Matlab是專利性程序語言,由MathWork團隊研發(fā),1984年投放市場,在學(xué)術(shù)和數(shù)學(xué)圈子里,這是個了不起的事件。Matlab之后一直被使用,因為它試用于數(shù)據(jù)歸集和數(shù)學(xué)建模,在學(xué)術(shù)領(lǐng)域應(yīng)用尤其多。調(diào)查發(fā)現(xiàn) Matlab 的使用程度在降低,Crowdflower分析顯示僅有10%到15%的招聘啟事中需要Matlab技能。
SPSS
在Crowdflower分析中SPSS和Matlab打成了平手,正是SPSS使得IBM公司進入高德納高端分析魔力象限中的領(lǐng)導(dǎo)領(lǐng)域,許多大學(xué)將SPSS作為分析學(xué)位項目的課程之一,2009年IBM公司獲得SPSS,當前開發(fā)了一系列的相關(guān)產(chǎn)品。
Julia
Julia不是人人皆知,與其他人們耳熟能詳?shù)墓ぞ呦啾龋€比較新,不那么成熟。一年前,Julia的發(fā)明者開展了一些列的啟動儀式:提供培訓(xùn)、需求商業(yè)支持,為有意愿使用此語言工具的人員提供咨詢。與其他一些有專利的數(shù)據(jù)科學(xué)工具相比,Julia是一個免費替代品,而且根據(jù)VentureBeat的調(diào)查,Julia比諸如Python以及R語言更時髦。
spss modeler:
spss statistics:
詳情請咨詢!
客服熱線:023-66090381
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn