余凯:智能不等于智慧 别说计算机比人聪明

我们来看看一些成功的应用,比如在计算机领域的图像识别,从最原始的输入图像出发,然后中间不断抽取数据、变换、训练。

计算机比人聪明?这样说你就错了

Image Net是是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。从2010年,它的水平在不断提升。最大的进展发生在2012年,因为深度学习的接入带来巨大的提升,但是计算机比人更聪明吗?不是,它是比普通人识别更多,但绝对比不过专业人,它绝对没有比人更聪明,计算机是在某件事情上优化一件事情,但不代表整体上比人更强。

现在,技术可以识别非常潦草的手写电话号码、任意方向的文字检测、人脸识别(如基于深度学习的人脸识别技术:百度魔图),甚至做一些更严肃的事情,比如自动驾驶。现在很多公司都在做自动驾驶,听起来很科幻的事情,但是业界推进的速度非常快。

汽车有两大趋势:新能源和智能化。这两个趋势无可阻挡,汽车也变成了机器人,视觉处理显得尤其重要,对于安全而言,最重要的是处理未知,做到全方位的感知,预见情况。

计算机比人聪明?这样说你就错了

语音识别也是另外一个应用,目前句子的理解力在75%左右,如果能达到90%就非常可怕。从音速特征、语言特征到最后的文字识别结果,语音识别为什么这几年会快速成长?这是因为在前端植入语音神经网络的小尝试,使语音识别可用,带来革命性的变化。基于深度学习的语音识别,可用于地图导航、输入法、移动搜索。

怎么去理解自然语言呢?传统的做法是把大问题分解成独立的子问题,然后分别做出分析。现在新的系统是用一个完整的深度学习模型,它可以对句子进行语义的关联阐释,从而训练一个对话系统,我们可以用好莱坞人物的对白进行训练。我们甚至可以把语言和视觉结合在一起,因为我们对世界的认知能力在语言认知和视觉认知能力上,是同步发展的。计算机今天看到图片也可以开始产生语言文本了,做到同时理解图像和自然语言。

而在有的场景,云端处理是不够的。未来人工智能发展的趋势,它的前端部署是偏感知的,后台偏大数据认知,比如自动驾驶,周围200米范围内的一举一动,都通过前端的传感器感知决策,5公里以外的情况是通过云端的大数据分析来获得认知,于是形成前后端的结合。

计算机比人聪明?这样说你就错了

回到一个问题:人类大脑是通用处理器吗?人从猴子到现在的人类,人之所以能够从物种中脱颖而出,是因为大脑对人类所需要特殊能力不断进行优化。除此之外的,是大脑是不擅长的,本质上来说,大脑是专用处理器,并非通用处理器。

大脑的计算是很慢的,但是人怎么会开车、打乒乓球?是因为对这些问题进行了加速处理。今天我们为什么有一些事情处理得特别好?因为我们在结构上做了专门的优化。

我们现在做的地平线机器人技术,是为了帮机器人开发专用处理器,我们希望将它的性能提升1000倍,希望硬件可以支撑这样的应用,让效果变得更好。

智能不等于智慧

计算机比人聪明?这样说你就错了

人工智能大规模的应用伴随着互联网的发展,在第一个10年(2000-2009年)是“润物细无声”的时代,最大的应用在于PC互联网,比如搜索、广告、推荐。

我们当前所处的10年(2010-2019年),语音、图像、语音、机器人操作获得突飞猛进的发展,同时在改造传统行业,越来越多地被人所感知,这是一个于“无声处听惊雷”的时代。

后面的10年(2020-2029年)是一个很灿烂的时代,是“江山如此多娇”、交互无处不在的时代,人跟机器的操作距离越来越短,生产线的工人一定会被替代,该机器做的事情,让机器做,该人做的事情让人做。简单、重复性的工作需要被解放,从万物互联到万物智能,数据成为商品。我们不需要对机器有太多的担心,2029年的机器没有好奇心、没有情感、没有自我意识。