百度度秘总经理景鲲:DuerOS要做AI时代的安卓

我们内部在跟很多合作伙伴一起合作,所以我们能看到很多数据。我们看到的数据是很正向的,很多用户在接受这种新的智能设备之后,从原来的好奇、到后面每天在一些固定场景的使用,其实都能够养成一些习惯。这也是我们看到很多公司在不遗余力的推动这个方向背后,看到的一些信号。所以从我们的角度来讲,我觉得是非常有信心的,是很正面的,用户在接受这种新的交互。

提问:我来自搜狐科技。今天上午Robin讲到免关键词的这种自然语言交互方式,我以前也了解过其他厂商类似的方案,觉得这种产品用关键词的话,可能隐私性相对好一点。如果没有关键词的话,有可能要把平时说的话识别出来上传到云端,然后再传下来理解,隐私的问题怎么保护?另外一个问题就是,现在有些厂商他们也推出了全栈式的语音开放平台,DuerOS这边怎么看待这个事情?以后有没有相应的计划?

景鲲:我觉得这两个问题都问得特别好。第一个问题,隐私问题特别关键,可能很多媒体朋友都很关心。我稍微解释一下,Robin的那个演示,他有些细节,不知道大家有没有关注到。他是戴了一个耳机,我们在手机上的这种自然语言交互现在的前提是都需要戴着一个耳机,耳机是一个很私人的设备。另外他是用的手机百度的一个特殊模式,就是听新闻的模式。如果大家下载手机百度9.0,这个模式是要先打开新闻,然后APP会提示你,已开始听你说话。然后再提示你,戴上耳机更好。这个免唤醒词目前是这样的一种体验。并不是家里的一个设备,一直在听用户说话。

提问:或者类似于那种智能音箱。

景鲲:现在还没有用到智能音箱,因为智能音箱在家庭场景中的隐私、不同场景的隐私都是需要特别处理的。所以这种免关键词的设备,目前就是在手机App中配合耳机来使用,并不存在隐私方面的问题。在家庭隐私方面,其实大家都会有很多考虑。比如说现在业界普遍的做法是先唤醒它,再跟它说话,这个时候才会跟云端有直接交互。你不唤醒它,这个设备跟云端没有任何交互。这是关于隐私方面的问题。免关键词是Robin在限定的场景、限定的设备上实现的。

你提到的一些公司研发语音套件,我其实特别高兴,我跟他们是很好的朋友,在朋友圈里面有时候私下聊一聊。我觉得尤其在中国市场,甚至在国外市场也是一样,推动的人不能是一家,要是一个产业,大家一起做。刚才我讲到产、学、研,最好是产学研一起推,这个事情才走得快。所以我永远觉得,市场最健康的时候是大家都往前推的时候。所以我特别开心,有些其他公司,包括将来的合作伙伴大家都在一起推进,我觉得这对产业是一个特别好的事情。

提问:有没有相应的一些计划?咱们会不会也会出全栈式的设备?

景鲲:我刚才说的DuerOS,其中有一块是更好、更多的语音解决方案,所以我们就会有一个跟声智科技合作的全栈式开发套件。为什么会推出这个?我们都是基于合作伙伴反馈的。我们在开发者大会的时候推出的是一个单独的语音识别的套件,要搭配树莓派一起用。有些开发者说做成一体化得更好,所以我们今天下午也会宣布跟声智公司合作了,一体化的解决方案。

提问:我们知道,做一款语音交互的智能产品需要很多的技术板块,比如信号降噪、语音识别等等,需要很多技术合在一起。今天我们看到很多的技术是拿来主义,比如语音识别用A厂商的,还有用C厂商的。然而拼凑就会有问题,比如一个做信号降噪和一个做语音识别的公司对接,前者的技术目标可能是降噪,让耳朵听起来清晰,但是耳朵的机理和机器是不一样的,所以对后者而言,前者的信号处理是一个黑匣子。物联网的时代,做产品的复杂度不是一个量级的,上下游之间耦合的时候会存在巨大的摩擦力。而且有一个地方堵住了,全部就都堵住了。我也听到一种业界的声音,人工智能行业短时间很难出现真正的操作系统。因为完全不一样,没法标准化。所以有人说,在业界走的比较久的人,他们会自己提到端到端,他们很难是一套操作系统。所以我想作为操作系统的代表,DuerOS怎么看待这个事情?