最近大家应该经常听到谈论起 “小冰,peter” 这些行内智能机器人名人,从事人工智能研发的各家似乎都有了各自的代言人,悄悄的机器生物好像来到了我们身边。人工智能关健技术深度学习是在云计算和大数据日趋成熟的背景下取得实质性进展,云计算为深度学习提供了平台,大数据为深度学习提供了矿石,深度学习因此才得以在云平台、在大数据中淘出黄金。
事实上大数据在机器生物的进化史上起到了举足轻重的作用,不管是语音、图像识别,语义计算,所有的都是在拥有足够大数据的基础上,互联网,移动互联网带来的大数据是人工智能研究进了一大步的关健原因,另外深度学习神经网络大大提高了语音和图片系统的识别率,但同时对支撑大数据平台的云计算也提出了更高的要求。很多人工智能专家提出,大数据和人工智能与云计算的发展不符。
从google的人工智能引擎TensorFlow开源说起,相比它facebook的Torch,微软的DMTK,BM的SystemML. 不能不说TensorFlow对异构端的支持和强大灵活的算法 是众多人工智能开源项目的独有的,这也可能是其成功的关健。人工智能研究常常需要强大的就算机集群,机器学习需要训练各种算法,需要在数万台机器编写深度学习软件,构建深度学习网络。
TensorFlow可以用来编写各式各样的算法,包括深度神经网络模型的训练和干扰算法,并且它已经被用于实验研究中,也被部署在产品的机器学习系统中,已经被应用于十几种计算机科学以及其他学科的领域中,包括语音识别、机器视觉、机器人学、信息检索、自然语言处理地理信息提取以及计算机辅助药物设计。
笔者认为TensorFlow可以融合各种计算能力,又是有希望建立一套通用的深度学习模型的人工智能平台,其开源项目给很多开发者带来机会。科研部分需要用到GPU计算,研究成果实现商用时就更适合用CPU计算,GPU与CPU的融合计算是人工智能、生命科学研究对计算提出的新的要求。通常的理解CPU负责计算GPU负责图处理,CPU的通用性更更好,但单个CPU性能成为整个系统运算能力的瓶颈,CPU+GPU是一个强大的组合,CPU包含几个专为串行处理的优化心,GPU则是专为并行处理而设计,由数千个更小,更节能的核心组成。
CPU运行程序中行部分,GPU运行并行部分。一个科研项目在研发阶段往往对GPU运算用得比较多,商业阶段后就CPU运算更多,不管是在研发过程还是商用阶段 GPU+CPU都不是完全独立,所以现在云服务提供商们应需整合资源提供GPU+CPU 计算服务。宝德科技在高性能计算一直走在前列,早大与华在基因完成了第一张黄种人基因图谱的绘制和大熊猫基因图谱的绘制,最近又推出一全系列支持多GPU的高性能服务器结合宝德云公有云,私有云多种方式,宝德云计算为人工智能、生命科学,高能物理等科研项目提供了全方位的计算服务。
Facebook 、Google、 微软、IBM 先后开源的人工智能项目将会来给越来越多智能的服务,高性能计算与云计算将交融参与其中。在计算的交融,大数据的交融,商业生态的交融将现将开启生物智能和智能生物和谐共生的新场景。