原創|行業資訊|編輯:陳俊吉|2017-11-09 16:23:18.000|閱讀 344 次
概述:基于 Github 和 Stack Overflow 上的活躍度以及 Google 搜索結果,The Data Incubator 最近制作了一個 23 個熱門深度學習庫的排名。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
基于 Github 和 Stack Overflow 上的活躍度以及 Google 搜索結果,The Data Incubator 最近制作了一個 23 個熱門庫的排名。
下表顯示了標準化后的分數,其中值 1 表示高于平均值的一個標準偏差(平均值為 0)。 例如,Caffe 在 Github 中的活動是一個高于平均水準的標準差,而 deeplearning4j 接近平均水平。見末尾的方法。
該排名基于三個同等重要的部分:Github(star 和 fork),Stack Overflow(標簽和問題)和 Google 搜索結果(總和以及季度增長率)。這 3 部分是通過可用的 API 獲得的。想弄一個全面的深入學習工具包列表不容易,所以在最后選取了我們認為具有代表性的五個不同的列表(有關詳細信息,請參閱下面的方法)。計算每種度量的標準化分數,使我們能夠看到在每個類別中哪些包是脫穎而出的。
TensorFlow 在所有計算度量上的平均值上至少有兩個標準偏差。TensorFlow 和第二大流行框架 Caffe 相比,在 Github 上的 fork 數幾乎是后者的三倍,在 Stack Overflow 上的問題總量是后者的六倍以上。TensorFlow 由 Google Brain 團隊于 2015 年首度開放,已經超過了眾多的高級庫,如 Theano(4)和 Torch(8),成為我們榜單的首位。TensorFlow 雖然與在 C++ 引擎上運行的 Python API 一起分發,但表中的幾個庫可以將 TensorFlow 用作后端,并提供它們自己的接口。這些庫包括了 Keras(2),將很快成為 TensorFlow 和 Sonnet 的核心部分(6)。TensorFlow 的流行可能是其通用的深度學習框架,靈活的界面,好看的計算圖形可視化和 Google 的重要開發人員和社區資源的合力下的結果。
Caffe 在我們的名單上排名第三,除了 TensorFlow 外,Caffe 其在 Github 上的活躍度比其他競爭對手都要多。Caffe 傳統上被認為比 Tensorflow 更專業,并且專注于圖像處理,目標識別和預先訓練的卷積神經網絡。Facebook 于 2017 年 4 月發布了 Caffe2(11),并且已經排在了深入學習庫的上半部分。Caffe2 是一個更輕巧、模塊化和可擴展的 Caffe 版本,包括循環神經網絡。Caffe 和 Caffe2 是相互獨立的倉庫(repo),所以數據科學家可以繼續使用最初的 Caffe。然而,有一些遷移工具,比如如 Caffe Translator,它提供了一種使用 Caffe2 來驅動現有 Caffe 模型的方法。
Keras(2)是排名最高的非框架庫。Keras 可以用作 TensorFlow(1)、Theano(4)、MXNet(7)、CNTK(9)、deeplearning4j(14)的前端。在所有的三個衡量標準上, Keras 的表現均優于平均水平。Keras 的流行可能是由于其簡單性和易用性。Keras 允許快速的原型化,但代價是犧牲了從框架直接運行而產生的一些靈活性和控制。數據科學家在數據集上做深度學習的相關實驗時,Keras 受到了他們的青睞。隨著 R Studio 最近發布了 Keras 的界面,Keras 的發展和受歡迎程度還在不斷延續。
在新的的海洋中,Theano(4)是我們的排名中最古老的庫。Theano 開創性地使用了計算圖(computational graph),并在研究界普遍做深度學習和機器學習之時仍保持流行。Theano 本質上是一個 Python 的數值計算庫,但可以與像 Lasagne 這樣的高級深度學習庫(15)一起使用。雖然 Google 支持 TensorFlow(1)和 Keras(2),Facebook 支持 PyTorch(5)和 Caffe2(11),MXNet(7)是 Amazon Web Services 的官方深度學習框架,Microsoft 設計并維護了 CNTK(9),Theano 在沒受到行業巨頭的正式支持下依然流行。
2017 年初,Google 的 DeepMind 公開發布了 Sonnet(6)的代碼,這是一個以 TensorFlow 為基礎的高級面向對象庫。Sonnet 的 Google 搜索結果返回頁數比上個季度增長了 272%,是我們列表中所有庫中最大的。盡管 Google 在 2014 年收購了英國人工智能公司DeepMind,但 DeepMind 和 Google Brain 仍然在大體上是獨立團隊。DeepMind 專注于通用人工智能,Sonnet 可以幫助用戶為他們的具體 AI 想法和研究做頂層設計。
PyTorch(5)是我們表中增長速度第二的庫,該框架的唯一接口是 Python。與上季度相比,PyTorch 的 Google 搜索結果增加了 236%。在我們排的 23 個開源深度學習框架和包裝器中,只有三個沒有 Python 接口:Dlib(10)、MatConvNet(20)和OpenNN(23)。在 23 個庫中,C ++ 和 R 接口分別只有 7 個和 6 個。雖然數據科學界在使用 Python 方面有些接近同一個共識,但對深度學習庫而言,還有很多的選擇。
當然,有些庫由于已經存在了更長的時間會有更高的數據,因此排名更高。唯一考慮到這一點的指標,是 Google 搜索季度增長率。
數據呈現中遇到的一些困難:
所有源代碼和數據都在上。
我們首先從五個不同的來源中生成了 23 個開源深度學習庫的列表,然后收集了所有這些庫的指標,以獲得排名。Github 的數據基于 star 數和 fork 數、Stack Overflow 的數據包含包名稱的標簽和問題,Google 搜索結果則基于過去五年的 Google 搜索結果總數,并計算結果在過去三個月與前三個月相比的季度增長率。
一些注意事項:
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn