科大讯飞胡郁称十年后每个人都离不开人工智能

最后我想说一下科大讯飞到底在做什么?正是因为有前面理论的这些基础和我们对将来的一个设想,科大讯飞正在做的一件事情就是讯飞超脑,我们要做语音和语言为入口的机器认知革命这里面包括感知智能和认知职能。这是我们整个的讯飞超脑的一个图,这个里面要模仿我们人类的感知智能,通过这个以后,我们要上升到人的认知的层面,我们有个Think Machine,可以对你的概念进行推理和解决。解决完了之后有一个执行,这一项技术我们其实最近已经取得了很好的成果,我给大家介绍一下。

正是因为科大讯飞在整个的深度神经网络方面,大家都知道前两天在北京开的中国人工智能大会中我们请到了科大的校友,也就是我们讯飞语言及语言信息处理国家工程实验室的邓教授,他是和微软一起把神经网络共同做成功的着名的国际学者。在他们成功三个月后,就是在2009年的12月份我们就知道了深度神经网络其实是可以用于我们的人工智能计算的。在过去的五到六年中间,科大讯飞不止一次的第一次把神经网络用在语音和语言的各个方面,比如说语音合成、语种识别、语种识别、自然语言处理等等。

现在我们取得了什么样的成果呢?大家都知道我们的声音其实在我们的脑海里面,在声音处理里面能够看到有一个语音谱图。非常牛的人员,利用这个语音谱图来判断。我们现在做的成果可以利用图像处理的方法处理我们的语音,跟我们耳朵里面的听觉系统是非常接近。不仅仅如此,更加重要的是解决认知的问题,里面包括语音翻译、知识表示、联想推理和自主学习。我们也有非常多的核心的模块,在这里就不一一介绍了,包括自主的语意表示,进行逻辑推理。

现在我们做到了什么样的成果呢?我们也借用了人脑里面非常重要的注意力模型,右边这张图大家更感兴趣,左边是灯塔的图。右边上面是男人在开车的时候视野和关注的地方,下面这张图据称是女人开车时候的视野,视野很窄,所以说大部分的女性同胞可能出事故的情况比较多。

我们最新发布的一个产品是AIUI,我们非常希望能够跟所有的智能硬件进行非常自然的交互。但是大家都知道,用过语音交互的人,虽然讯飞语音云现在已经为18万的开发者每天提供超过25亿次的语音服务,而且我们还连接到8到9亿台设备,但是他们的感觉坦白来说并不好。利用的AIUI,因为时间的限制我们没有办法演示,我们将原来单次的交互变成全智能的交互,我们将语音识别、语音合成、自然语言理解和整个对话过程融为了一个整体。现在国内百分之八九十的产品都会连接到我们新的AIUI的产品上,给我们带来不同的体验。

大家可以看到,采用这项技术之后,我们对话的成功率从40%提升到了90%以上。另外讯飞超脑在感知认知方面的两项成就,我给大家简单介绍一下。一个就是关于口语评测,大家都知道,在世界上学习英语最痛苦的一件事情,你们会发现全世界都没有口语考试,为什么?因为口语考试没有办法改卷子。广东省曾经在高考中考过一次口语,77万考生录下音来以后,找了2千个英语的老师和师生来听,改了两个星期都没有改完,而且压力非常大。但是我们现在用机器的方法,可以自动的听懂你的口语里面说什么,还给你评价,你怎么样读错了,你的语音、语义这方面都可以评价出来,现在世界上只有中国在广西、广东、江苏可以中考里面考英语口语。不仅仅可以考口语,我们还可以考手写作文,我们可以对你的作文进行评价和批改。我现在还在带领863的一个专家团队,应该说是国内最大的一个团队。31家单位参加,近几百个老师,上百个教授在参与的中国的高考机器人,就是我们要做一个机器人参考高考,之后还能考上清华北大,看到题目之后它就可以给出答案,其实考试是评价人工智能一个非常重要的方法。可能我们自己说了不算,我们来一段请奥巴马同志对于我们科大讯飞是怎么评价的。

(播放视频)

奥巴马非常好,他都没有收我们钱,事实上我们现在可以让他讲任意我们想让他说的话。

我们期待也许将来也许我们可以看到非常好的物联网的世界,我们的手机,我们的智能家电,我们的智能家居,我们的玩具,我们的汽车,所有的机器人这一切都能够跟我们自由的交流,我们可以进入一个真正的机器认知的革命时代,谢谢大家!