本文对 23 个深度学习库进行了排名,衡量的标准有三个:GitHub、Stack Overflow 以及谷歌搜索结果。TensorFlow 凭借最大、最活跃的社区主导了该领域,排名第一;Keras 是最为流行的深度学习前端,排名第二;Theano 依然实力强大,即使没有大公司的支持,排名第四;Sonnet 是成长最快的库,排名第六。
排名
我们排名 23 个用于数据科学的深度学习开源库,排名的衡量标准有 3 个:GitHub、Stack Overflow 活动以及谷歌搜索结果。
上表中给出了每个开源库的总分值,以及各自在 GitHub、Stack Overflow 以及谷歌搜索上的得分(其中 0 为平均值)。比如,Caffe 在 Github 上的标准评分为 1,deeplearning4j 则接近 0。
结果与讨论
排名综合考虑上述 3 个方面而得出:Github(收藏量与 forks)、Stack Overflow(标签与问题)、谷歌搜索(全年与每季的增长率)。上述指标通过可用的 API 获取,所以得出深度学习工具包的完整列表需要一定技巧。计算每个指标的分值有利于我们知道在该方面深度学习库的排名情况。
TensorFlow 凭借最大、最活跃的社区主导了该领域
TensorFlow 在三个指标上的分值均为 2+;相比于排名第三的 Caffe,TensorFlow 的 Github forks 几乎是其 3 倍,Stack Overflow 问题是其 6 倍多。TensorFlow 由谷歌大脑团队于 2015 年首次开源,之后便一路攀升超越 Theano (4) 和 Torch (8) 而排名第一。尽管 TensorFlow 与运行在 C++引擎上的 Python API 一起分发,本次排名中的若干个库可把 TensorFlow 用作后端并提供其接口。这其中包括很快将成为核心 TensorFlow 和 Sonnet (6) 一部分的 Keras (2)。TensorFlow 的流行很可能来自于通用深度学习框架、灵活的接口、漂亮的计算图可视化以及谷歌大量的开发者与社区资源之间的整合。
Caffe 已经被 Caffe2 取代
由于比其他深度学习库(包括 TensorFlow 在内)更高的 Github 分值,Caffe 获得了排名第三的位置。Caffe 一般认为比 Tensorflow 更专业化,其开发聚焦在图像处理、目标识别和预训练卷积神经网络上。2017 年 4 月 Facebook 发布了 Caffe2,并已在所有的库中排名前半。Caffe2 相较于包含循环神经网络的 Caffe 更轻量化、模块化和可扩展。Caffe 与 Caffe2 彼此分离,因此数据科学家可继续使用 Caffe。但是,一些迁移工具比如 Caffe Translator 能提供使用 Caffe2 的方法以驱动现有 Caffe 模型。
Keras 是最为流行的深度学习前端
Keras (2) 是排名最高的非框架深度学习库,可被用作 TensorFlow (1)、Theano (4)、MXNet (7)、CNTK (9) 或 deeplearning4j (14) 的前端。Keras 的表现在三个指标上均高于平均值,其流行得益于简单性和易于上手。在数据集上进行深度学习实验的数据科学家尤其喜欢 Keras。随着 Keras 有了 R 语言接口,Keras 的开发与流行都将会继续下去。
Theano 依然实力强大,即使没有大公司的支持
新的深度学习框架层出不穷,Theano (4) 是排名中出现最早的库。Theano 率先使用计算图,在深度学习与机器学习社区中流行度不减当年。Theano 本质上是一个用于 Python 的数值计算库,也可被用于高阶的深度学习包装器,比如 Lasagne (15)。尽管谷歌支持 TensorFlow (1) 和 Keras (2),Facebook 支持 PyTorch (5) 和 Caffe2 (11),MXNet (7) 是亚马逊云服务官方指定的深度学习框架,CNTK (9) 由微软设计开发并为其所用,Theano 依然很流行,尽管没有得到任何一家大公司的青睐。