15款开源人工智能软件挨个数,哪一款是你的菜?

  开源人工智能

  人工智能是目前最热门的科研领域之一。诸如IBM、谷歌、微软、脸书和亚马逊这类大型公司不仅加大了对旗下发展研究部门的资金投入,同时也开始并购一些在机器学习、神经网络、自然语言与图像处理领域小有所成的初创公司。鉴于目前人工智能研究领域的火爆程度,斯坦福大学的教授们不久前作出了这样一份报告:“人工智能软件的作用越来越强大,而对人类社会、经济有强大影响力的人工智能软件将于2030年前面世”。

  国外网站Datamation今日整理了目前热门的15款开源人工智能软件,雷锋网 (搜索“雷锋网”公众号关注) 对全文进行了编译介绍如下:

  1.Caffe

物联网

  Caffe软件由加州大学伯克利分校的一名博士生开发,是一个基于表达构架与可扩展编码的深度学习框架。因其出色的处理速度而广受研究人员与企业的喜爱。根据其主页的介绍,只使用一颗NVIDIA K40 GPU,该软件一天就可处理超过6000万张图片。Caffe软件项目由BVLC运作,由NVIDIA和亚马逊等公司资助其发展研究。

  2.CNTK

物联网

  CNTK是Computational Network Toolkit(计算网络工具包)的缩写,是微软旗下开源人工智能软件之一。它的过人之处在于:无论是只有CPU工作,还是单科GPU,或是或多颗GPU,亦或是多台机器配备多颗GPU工作,它的性能都十分优秀。虽然微软主要用它进行语音识别的研究,但它还可以进行机器翻译、图像识别、图像抓取、文本处理、语言识别与语言建模等工作。

  3.Deeplearning4j

物联网

  Deeplearning4j是一款JVM开源深度学习库软件。它能在分布式环境中运行,并整合Hadoop与Apache Spark。而这使得它可以配置深度神经网络,还可运行Java、Scala等其他JVM语言。

  Deeplearning4j软件项目由Skymind商业公司运作,由Skymind负责项目的资金支持、人员培训与产品推广。

  4.DMTK

物联网

  与CNTK一样,DMTK是Distributed Machine Learning Toolkit的缩写(分布式机器学习工具),是微软旗下的另一款开源人工智能软件。为大数据研究而设计,旨在缩短人工智能系统的训练时间。DMTK包括三大主要部分:DMTK框架、LightLDA模型算法与分布式(多感)字嵌入算法。为了说明DMTK的处理速度,微软声称其可通过一台8节点计算机集群,在有着超过1000亿个标记的文档合集中处理出一个包含100万主题与1000万文字(总计10万亿个参数)的主题模型,而这是同类软件无法匹敌的。

  5.H 2 O

物联网

  更专注于企业使用体验而不是科学研究的H 2 O收获了如Capital alt="物联网" width="499" height="376" />

  Mahout 是 ASF(Apache软件基金会)旗下的一个开源项目,提供开源机器学习框架。据其官方主页描述,Mahout有三大主要特点:可扩展算法编程环境、事先写有如Spark和H 2 O等工具的算法、内置名为“Samsara”的矢量运算环境。Mahout用户的包括Adobe、Accenture、Foursquare、英特尔、领英、Twitter和雅虎等公司。

  7. MLlib

物联网

  以处理速度而闻名的Apache Spark已成为大数据处理中最常用的软件之一。MLlib算法是一个Spark的可扩展机器学习库。它与Hadoop融为一体,可与NumPy和NumPy.R跨平台操作。它囊括了大量机器学习算法类型,包括:分类、回归、决策树、建议、聚集、主题建模、特点转换、模型评价、ML pipeline构建、ML持久性、生存分析、频繁集、序列模式挖掘、离散线性代数和数据统计分析。