Mike:有两个方面的角度。第一,小娜从发布到现在,我们不断的在后台增加新的功能。举个例子,我们在Build上做的演示,我们经常在跟别人交流的过程中,做了很多的承诺。但是我们往往只能记住其中很小的一部分。小娜现在一个新的能力来说。现在有一个秘书替你看的这个东西,他会提醒你。比如,你答应Mike,过两天要跟他去吃饭别忘了。这种事是很容易忘的事,但是小娜从秘书的角度,他能主动的把不经意之间为别人提供的一个承诺,他给你抓住这个承诺,然后会主动的提醒你,让你不要忘记你的承诺。变成一个守信用的人。这是一个方面的例子,就是我们在后台,不断的增加了很多新的能力。
第二,随着用户使用数据越来越多。实际上小娜也是在后台不断的学习,学习过程中,我们可以知道他是用什么样方法完成一个任务,去查询什么样的一个信息。这样,对我们从质量的角度,做了很多的提高。包括从语音识别的准确性,和语义理解的一个准确性能力来说,都做了很多提高。
刚才举了两个例子,这两个例子,都是我们从用户和小娜交互过程中学到的。有的用户就会提到,让小娜帮关机。我们在刚开始设计的时候,其实没有考虑到这个问题,但是根据用户使用的量,还有使用的习惯,常用的东西我们就把他加进去。还有一些,就是我们常说的“现在几点了?”因为我们的设计理念就是,手机上已经有时间了,你为什么要问这个问题,我们当时就没有想到,直接就把他带到了搜索的一个界面里。实际上在用户的使用过程中,小娜也慢慢在养成这样的习惯,我们也是在不断的学习用户的行为习惯。根据这些习惯,我们对产品的定义,重新做了很多的修改。
因为小娜是基于很多服务在云端实现的。所以这样,实际上也是我们利用了现代软件开发带来的便利。以前我们在做这种软件开发的时候,很多时候都是有一个猜测,然后是一个实现。但是经过用户的反馈,你会发现有些猜测是对的,有些猜测是不对的。那对这些不对的猜测,我们很敏捷的能够用云端的一些优势,在云端做这些服务,做一些调整。所以以前,像这样的改动,一般来讲,他会需要一个产品周期,可能要一两年时间。我们现在很快就可以把他在云端改了,用户从终端这边,都能够体验跟访问到。
为了让这些助手非常的成功,所以深度学习的能力非常重要。因为在这种交互当中,经常会发现,有一些新的东西会出现,你怎么样能够快速的学习,能够给出一个变化,一个应答。有时候我们经常讲,同一个问题,过几天答案就不一样了。今天回答不了的问题,可能过几天就能够回答了。
记者:业内人士说,在智能语音助理这方面,会有三个层级,一个是语音识别,一个是NLP自然语言处理,还有一个是深度学习。我想问在自然语言处理这方面,小娜对于中国的本地化这种自然语言的处理,有一些什么样的措施,或者进行了一些什么样的改善?
Mike:实际上你刚才说的那三个层次的东西,第三层次的那个,深度学习实际上是一种技术的能力。实际上这个技术已经在不同的语音识别,在自然语言理解,他都已经被应用到了。所以如果Mike想做这三个层次的定义,可能是说语音识别、自然予以理解、任务完成。因为基于这几个东西,三层要完成一个任务。完成这个任务,从宏观和狭义上,都可以理解成,比如我给你一个正确答案,也是帮你完成一个任务。我帮你买了一份饭,或者买了一张机票,这也是一个任务完成的东西。所以那个类,我们先把你的三个层次定义一下。
从自然语义理解角度来讲,如果把它简化一下,我们可以看到,如何把自然的一句话,把他变的结构化。在结构化这里面,我们简单的一个东西就是,根据这个结构,我们希望将来可以把他变成一个知识库里的查询,或者是完成一个任务。另外一个观点就是,其实这对后台知识库的查询,有一个很重要的要求。比如咱们刚才举的例子,哪个餐厅里面有最好吃的饺子。他不仅仅是要查到餐厅,同时还要查到卖饺子的,同时还要查到饺子的评价会非常好。这里面,实际上这两方面都要去做,从NLP的角度上来看,能够把自然语言理解能力,从一个任何背景语言自然交互,自然的语言能够把他有更多的结构化出来。另外,对知识查询来讲,在这方面要做更进一步的投入。