李彦宏给全国工商联干部讲AI:别但心机器统治人类

讲一下人工智能具体包括哪些东西。这个问题原来在这篇上写了一个“百度大脑”,因为最早就是我在两会上提过中国大脑的概念,后来我说咱们自己开始先做百度大脑。百度大脑包括什么东西?就包括这四个东西,昨天我看到腾讯搞了一个活动叫“云+未来峰会”,他们想象的人工智能的布局,其实讲的也是这四方面,后来我就把“百度大脑”这个词去掉,既然现在大家都认为人工智能是这些东西,那我们就把它作为一个行业通用认可的做法来描述。

这些其实不是学术界认可的分类方法,更像是从工业的角度看,什么东西是更有市场影响力的。什么东西呢?语音识别的技术。一方面它是通用技术,另外一方面它是具体应用的。图像识别的技术,也包括视频识别,在学术界把它叫做计算机视觉。自然语言处理的技术,最早提出的图灵实验,就是说你人说一句话,机器能不能明白你在说什么?自然语言有一些叫NLP,自然语言处理,有些叫NLU,自然语言理解,这是一个意思。还有一个用户画像,用户画像这个说法实际上是在去年夏天提出的,之前没有的。去年夏天在硅谷和一些科学家讨论过人工智能,讨论百度大脑到底该包括什么东西?我们讨论出来说用户画像还是很重要的一部分,原因就是,人工智能本质上就是让机器懂人,明白人在讲什么,是什么意思?机器要想懂人的话,它得对这个用户有一个画像,有一个了解,所以我们认为这个东西是一个很重要的东西。

恰好,作为一个互联网公司,我们能够收集到大量用户的数据是可以把这个画像画出来的,画出来以后,怎么去理解它,这个是非常有意义的,理解是个很重要的大的方向。讲一下图像识别,图像识别最好的讲法就是给大家看一段视频。这是浙江卫视搞的一档叫《最强大脑》的节目,展示了一下百度的图像识别能力。

【播放《最强大脑》视频:小度和人类“脑王”的人机大战】

所以大家看到,人辨别不出来的差别,人工智能可以辨别出来,所以它在某些特定的领域经过一定的训练,它的能力是超过人的,所以这是一个比较典型的用人脸识别、图像识别技术,识别出来哪一张脸对应哪一个人的这么一个展示。

语音识别其实现在应用也比较广泛,大家平时使用百度搜索的话,你说话语音识别也可以很容易地去理解。这边也给大家做一个演示,是百度的轻声输入。语音识别经历了几个阶段,最早大概三四年前,刚刚有语音识别的时候,我们在三亚度假的时候,有个朋友讲我们可以语音识别,当时在一个餐馆里头,背景噪音很大,操作以后发现不行,平时在安静的环境下可以识别出来,到噪音环境下就识别不出来。现在不仅噪音环境下可以,今天演示的这个,你说话声音很轻的时候它也可以。

【展示百度轻声识别案例】

大家也看到,声音越来越小了,其实我们人已经听不见它在说什么了,但机器能听见。事实上,在搜索的场景下,人的听力,人的识别率,就是整个一句话都能一字不错听出来的(比例),是82%,机器现在做到87%,在这种单向的能力上,它经过训练是可以超过人的。我们曾经不习惯,所以老是觉得我要慢点说,其实没关系,你以为它听不明白,它现在都能听明白了。自然语言处理很多时候也是基于语音的识别,语音识别是什么呢?你说的这句话到底对应的是哪几个字。但是这几个字是什么意思,这背后是另外一种技术,叫做自然语言处理。

这里给大家讲一个应用,叫金牌销售,这个是什么呢?百度也有一个比较庞大的销售团队跟中小企业进行对接,这个团队只凭一个销售去负责,其实不是很靠谱,因为人员流动性很大,每次新的销售人员进来之后要重新进行培训,而老的有经验的、优秀的销售,他们出单的能力比新的销售要强很多。后来我们想说,既然老的销售这么厉害,那我们用机器学他,学他应对客户的技巧,然后放入工具给新的销售,当你给客户打电话的时候,客户问什么,我们用计算机马上识别出来客户问的是什么问题,然后理解这个问题,最后把最优秀的销售员回答这个问题的答案呈现在电脑屏幕上,告诉新的销售,那么新的销售等于直接照着屏幕念就行了。这样的一种做法就是我们在北上广深四个城市的百度的销售团队现在都已经实现了,成单率整体提升10%,效果还是非常非常明显的。而这里头就不是简单的语音识别说我知道客户问的是哪几个字,它得理解客户的问题到底是什么问题,然后再去找最优秀的销售回答这个问题是怎么回答的,与此同时,我们也利用对于客户的画像来有针对性地定制相应的答案。