现在相对比较成熟的是四个方面,一是语音识别,也是深度学习用的第一个成功的例子。语音识别目前的准确率已经可以达到在安静环境下达到97%,在方言、速度语速快了以后,比人类还要准确一些。在比较杂音的环境下,在车载环境下可以达到92%—93%左右,最近把一些新的算法用图像训练的方式用在语音识别里面,发现又可以提高10%—15%左右,语音识别现在已经非常实用。
二是图像识别,语音方面已经达到了很高的准确度。我们在语音方面也有很多产品,比如说用手机百度现在可以用语音搜索,你可以听到语音的合成。我们最近有一个产品“度秘”可以用到音响上,也可以用到车里面,这不仅仅是一个自然对话的软件,其实它是一个连接服务的一个载体,所以用“度秘”你可以订餐、订票、管理日程,也可以聊天,也可以帮你做体育解说,也可以唱歌,也可以作诗,后面连接了很多数据和服务。另外在图像和视频方面,刚才Facebook的石峰讲过,很多方面由于有大量的图像和视频,这个时候需要找到一个模式,人脸识别相当成熟,目前已经到99.7%的准确率,比人眼更准确了。在图像视频的自动描述方面,也越来越精确了,比如说根据视频可以知道这是一个小狗在玩水,这边知道是一个火车沿着森林驰过。
所以说AI真正会带来一些新的变革,可以用到每个方面,可以说医疗、教育、金融、交通,也可以用到无人车上,再举一个简单的例子,比如说医疗方面,医疗方面我们最近有一个百度医生的产品,其实就是用一个像医疗的机器人,可以阅读大量的医疗文献、资料、病人的病例,模拟人和医生自然的交流、问诊的流程,然后可以把这些信息告诉医生,也可以把这个信息告诉病人,这对于现在目前我们中国医患紧张问题有很大帮助,现在有很多好医生,但也有很多病人,医生和病人之间的沟通还是有很多的问题。这个可以帮助基层医生提高诊断率,也可以帮忙专家医生,让他们减少问诊的时间,这个系统已经开始使用了,数据越多会越准确,因为这是一个自我学习、自我提升的一个过程。
举一个例子,目前用百度手机医生马上可以实现,我们叫“智能小e”机器人,医生很多时候需要花很多精力了解病人问诊,用“智能小e”就可以省去很多过程。另外一方面就是出行,今天下午我会多讲一下,在智能驾驶方面取得的进展。刚才我觉得杰瑞·卡普兰讲了一个很有趣的例子,人工智能有些方面比较聪明,有些方面比较笨拙,我们经常开玩笑说机器人可以开车,结果打不开车门,所以在智能驾驶方面,目前确实取得进展比我们想象的要快很多,百度有两个路径,一个路径是L3,是一个比较渐进的,在有限的条件下进行自动驾驶、智能驾驶,根据现在的高精地图、精准定位、计算机视觉然后和厂商进行合作,包括车联网、操作系统这种比较现成的技术。
还有一个L4,完全无人驾驶,这对整个环境、技术要求相对比较严格。L3和L4有很多共同之处,大部分的平台数据,包括机器学习的算法都是可以共享的,但是整个假设的环境是完全不一样的。L3我就不细讲了。L4,大家已经体验了,百度去年差不多这个时候,第一次完成了路测,在北京的五环完成的,这一年取得了很大的进展,我不知道大家有没有机会试一下我们的无人车。在乌镇,现在我们有十八辆车,相对去年取得了很多进展,比如说更复杂的路况、像下雨天有雾霾的天气情况下都可以使用,有更多的传感器,有更强的学习能力。这个方面我们收集了很多数据,把数据放在云端进行学习,最后再传到汽车上,但是大部分决策是在汽车上,这样即使不联线,还是可以自动驾驶。
我也提到了人工智能可以用到各个方面,我们也希望把我们的平台和整个行业共享,所以我们今年九月份开放了两个平台。一个是机器深度学习的平台,叫PaddlePaddle。另外一个是百度大脑,我们把这些能力语音、图像、自然语言、用户画像开放给大家,希望大家一起推动中国人工智能以及全球人工智能行业的发展。蛮有意思的,我记得三十年前比尔·盖茨讲希望有一天机器能像人一样听去看去写,用自然语言交流,今天他提的目标在很大程度上已经达到了,人工智能很有意思,我做计算机研究,最早的时候我们学机器语言,学编程。后来是机器来学人的语言。未来一方面机器要向人学习,人也要向机器学习。