这是我们在很多智能硬件上做的一些尝试(展示一个自动驾驶视频),未来可能是用各种传感器武装到牙齿。为什么你要在中国做自动驾驶呢?这当中有的是纯技术问题,有的是国情的。我跟同事有时开玩笑说,我们在中国做自动驾驶,这个技术一定是全世界的,但Google在美国做的技术一定不是全世界的,它不能处理中国式的过马路,它不能处理我们的井盖被撬掉(观众笑)。因为人工智能是基于大数据的智能,没有这些数据你是绝对不敢做的。我们在这样环境下开发出来的技术一定是放之四海而皆准的。
这是基于图像的这种实时的道路场景的理解、融合、深度学习的技术,我们对交通标志、道路线、对车辆、对标示都要做到实时的识别。今天我们可以做到什么程度呢?这方面的一个Benchmark,我们可以看到第一名和第二名都是百度的,而且比第三名的结果好非常多。这是我们用一个没有训练的人去标识数据(交通场景图片),我们会发现机器做得比人还要好。比如说这个人和交通标志遮住了后面的车,只露出一小部分,人没法意识这个车的存在,但机器可以识别。这样基于传感器去驾驶可能会更加的安全。前段时间Elon Musk说,未来人类开车是违法的,这个有可能成为现实。
这是对车道的一个理解。刚才讲的我们为什么要做定位呢?我们有一个现实的目标,就是做一个基于实时场景的增强现实导航系统,在北京开过车的人可能知道,那么多主路辅路,比如说西直门立交就基本就和中国联通的Logo一样了。基于实时场景的增强现实导航系统,它比基于语音的 导航或者基于二维的地图导航更加场景化。我们认为自动驾驶应该是一个渐进式的过程,从辅助驾驶到主动安全,到限定条件下的自动驾驶,到高度自动驾驶,在每一步都会有商业机会。我们要构造的不是一个取代人的系统,而是一个人车一体的系统。任何车的关系就像人和马一样,但马是可以控制的。
最后我想总结一下,我们认为在5-10年里,下面三件事情一定会成为必然:第一个是所有设备都有智能传感器,第二是所有设备它一定都有云端大脑,第三是所有设备从单一功能的设备变成连接人和服务的节点。我们可以看到手机经历了这个过程,过去手机就是打电话,今天的手机,你一天打几个电话啊。从这个角度讲,所有设备最后都会成为一个广义的机器人系统:它都有感知,都有理解,都有决策。
我们技术人员常常觉得,将机器变得非常强大是一件很酷的事情,但实际上这并没有产生巨大的价值。像以前的深蓝,在一个场景下可能比人做得还好,但并没有这个世界产生更多的影响。而像Google和百度这样的搜索引擎,它拉近了人和信息的距离,它产生的巨大社会价值,才能够去实现巨大的商业价值。这种技术的伟大,不在于让机器更伟大,而在于让每个平凡者变得有创造性,变得更伟大。
这句话大家都很熟悉,我改了一下:世界是我们的,也是机器人的,但是归根到底是属于会控制机器人的人的。谢谢大家!