张亚勤:人工智能进入第三季 正是爆发时机

第三届世界互联网大会继续在乌镇举行。在上午的移动互联网论坛上,百度公司总裁张亚勤发表主题演讲,他认为人工智能在诞生60年之后,目前进入第三季,正是爆发的时机。百度希望与各个行业共享人工智能平台。

张亚勤在演讲一开始讲了两句话:“人工智能很了不起,人工智能没那么神秘。”过去一年间发生了两件事:第一,人工智能先驱马文·明斯基(Marvin Minsky)去世;第二,AlphaGo战胜了人类棋手李世石。张亚勤回顾,这60年间人工智能有高潮有低谷,目前进入了第三季,是爆发的时机。人工智能真正爆发是在过去10年,特别是过去5年,人工智能在语音识别、图像识别等方面有很大突破,很多人才从研究界走入企业,企业有大量的数据、有很强的计算能力,这是人工智能真正用到服务和产品的主要原因。

张亚勤谈到,人工智能需要超强计算、海量数据和神经网络。百度有多种模型和算法、万亿级参数和全球最大的神经网络。百度在语音和图像识别方面取得了很多成果,目前已经开始应用在医疗、驾驶等方面。希望把百度的平台与行业共享,一起推动中国人工智能和全球人工智能的发展。(温泉)

以下是演讲全文

大家早上好,谢谢小川,今天这场很火,看到大家对人工智能特别关注,最近我去的所有会议或者是论坛,不管是大型的还是私下的聚会,基本上都在谈人工智能。我想讲两句话,首先,人工智能是很了不起的。第二,人工智能没有那么神秘。

今年是人工智能六十周年,有两个标志性的事件:一个是六十年前人工智能主要的提出者去世了,另外一个就是AlphaGO在围棋比赛当中赢了人类,赢了李世石。如果看一下这六十年,人工智能经过了很多波折,有很繁荣的时候,也有它的冬天,现在可以说进入了第三季。我认为第三季应该是爆发的时机。

如果我们看一下的话,最早的时候一开始大家想的很简单,我们对人的大脑更了解之后提出一些规则,还有一些符号,然后把它们用到人工智能系统里面,后来发现这个不奏效,又产生了专家系统,数据多了一些,规则更详细一些,发现还是不够有效。真正的人工智能工作应该是二十年前,这个时候用统计的方式,用机器学习的方式,还没有深度学习,用各种各样的算法,遗传算法、各种算法,其实已经广泛的用到了这个行业,小川他们做搜索的,搜索其实是用人工智能时间最长的,包括一些做推荐广告,用了很长的时间。

真正爆发的话应该是过去的十年,这是快速发展的十年,就是深度学习的算法,在第一篇深度学习文章以后,就发现深度学习用神经网络是一个很有前景的道路。这几年特别是过去的五年,在云识别、图像识别、语言理解都有重大的突破。还有就是很多人才,人才原来从学术界走入企业。走入企业之后有一个很重要的特点,就是企业里面有大量的数据,然后有很强的计算能力,这也是为什么人工智能现在开始成为真正的成为主流,真正应用到服务、应用到产品上的重要原因。

PPT上写了几个公司,百度、谷歌、Facebook、微软,这是最近《财富杂志》评的四个AI公司。其实现在很多公司AI做的很好,刚才联想的元庆讲的把智能设备用到云里面,小川做搜索也相当好,IBM也是我们学习的一个很好的模式。

我刚才提到了三个方面,一、是更先进的算法,二是超计算能力,三是海量的数据。百度公司这三个方面也都有不少的进展,我们的算法现在有许许多多各种各样的模式,有万亿级的参数,有全球最大的深度神经网络,有千亿级的特征训练、千亿级的样本,规模相当大。

10:59[张亚勤]第二点我们的计算能够很强,我们有几十台服务器,而且有很多CPU,有很多CPU集群,这样的一个计算,其实加速了神经网络的收敛,很多数据需要快速的收敛,现在我们可以搭建一百多层的深度神经网络。我记得十几年前我们做神经网络做到三层不得了了,现在一百多层都比较容易了。

另外就是数据,百度有很多很多数据,有很多网页的数据,有很多搜索的数据、定位的数据、交易数据、行为数据。通过这些数据可以很容易地打造独特的知识图谱,打造用户画像以及商业逻辑。这些东西我们把它叫做百度大脑,百度大脑就是有计算有服务器,有许许多多的数据,然后由先进算法组成。这里面有很多模块和能力。