百度度秘总经理景鲲:DuerOS要做AI时代的安卓

提问:刚刚他们都说到我们之后要推一个没有唤醒词的设备,我很好奇,我们在开发者大会的时候收购了一个做唤醒词的小的团队,我想知道他们在这4个月当中是承担着一个什么样的角色?为什么我们收购了这样一个做唤醒词的小的团队,现在我们又推出无唤醒词这样一项技术?

景鲲:它只是在手机百度App这个环境里面,朗读模式免唤醒词。不是在家庭环境中的那种智能设备的唤醒词,那是做不到的,而且也存在一些隐私问题。所以只是限定场景,限定在App里面的人机交互。在家居的智能交互里面,唤醒词是必不可少的,因为有一定隐私的保护性,先唤醒它之后再跟它说话,没唤醒之前,他不跟人做任何的交互。我们收购的公司叫KITT.AI,是做智能家居领域智能交互的唤醒词的。我们很多合作伙伴都想做自己的唤醒词,包括DuerOS赋能的音箱、冰箱、电视,他们都需要在设备上为唤醒做优化。他们往往需要针对设备优化。因为麦克风的距离不一样,麦克风的个数不一样,所以需要对于这些设备进行特别的调优才能真正保证好的用户体验。通过KITT.AI,我们已经把这种技术推给我们的合作伙伴,搭载在他们的麦克风里面,使得效果更好。

提问:我们这次推出的智能硬件是搭载DuerOS系统的,和之前搭载这个系统推出的其他产品有什么能力上的差别?

景鲲:它是首先搭载DuerOS 2.0的。DuerOS 2.0实现了各方面的能力升级,其他的设备基本上都会被升级到DuerOS 2.0上。渡鸦相当于DuerOS 2.0的第一个标杆,我们后续会把DuerOS 2.0开放给我们的合作伙伴。

提问:我来自机器之心。DuerOS这个名字里面,我觉得OS应该是重点,现在各个语音厂商也都是有自己的平台,模式其实看来是大同小异的。我想知道一下,DuerOS在一些商业模式、内容模式和本身技术的模式方面和其他家的差异化在哪里?对于OS这两个字母,我感觉定义的是有一点模糊。如果搭载在一个智能音箱里面,我们跟它对话交互,它就算是一个OS。其他家的这种系统也是搭载在音箱里面能交互,为什么Duer就能叫OS?

景鲲:首先你提到商业技术能力,商业化目前不是我们的目标。我觉得在关键时候,先把用户体验做对了,这是最重要的。如果用户体验没做对,商业都白扯,可能还到不了那一步,所以用户体验最重要。对话式AI大家都在做,大家都看好这个方向。7月5日我也在说,科技版图上四家最大的公司都在做对话式AI。每家公司在做的时候,基本上都会沿用之前这个公司比较擅长的。它就自然变成了这个产品最大的特色,基本上可以这样看。每家的DNA不一样,每家做了这个平台之后,感觉也是完全不一样的。DuerOS是把百度最强的能力发挥出来的一个平台,所以百度跟其他平台有什么不一样、DuerOS就有什么不一样。比如有的友商语音识别做得很多,只是语音转文字的。百度以前最大的市场是百度搜索的生态系统,百度对语言的理解是百度最大的不一样。所以百度最大的不一样放到DuerOS上,这就是DuerOS最大的不一样。相当于DuerOS对语言的交互,对语言理解之后,还可以把更多的内容和资源,以及开发者,原来我们的开发者是网站开发者,后来是App开发者,把这些都聚到一起。所以DuerOS就变成了一个窗口,去访问原来百度后面生态平台的很多资源。所以DuerOS就是百度AI能力和资源集大成者的一个缩影,是对话式人工智能的一个缩影,所以它最大不一样就是百度的势能跟其他的公司不一样。如果你这样去评估别人的平台,也能得到一样的结果,就是每个平台背后都有他整个公司的缩影,这就是这个平台最大的不一样。

对于OS明确的定义,其实最开始是我提出来叫OS的。我对OS更多的看法是它是一个生态,一个操作系统。操作系统背后是一个生态,是一个平台,不仅仅就是音箱的一款产品。这取决于业务的发展思路,是做一款东西,还是想做成一个生态,把大家在这个平台上一起推动发展。我觉得DuerOS代表了我们的愿景,OS就应该是一个生态。我稍微引申一下,一个OS最核心的关键点,不是它叫不叫OS,是它是不是有自己的生态。如果他没有自己的生态,它就不是OS。移动时代有很多OS,有很多OS叫OS,但是后来你发现,它都没有自己的生态。有自己的生态的全都可以称为OS,Android有自己的生态,可以称为OS,Windows有自己的生态是OS,如果你是附着在这些平台上的就不能叫OS,因为你没有自己的平台。所以我们DuerOS也是希望在语音交互这种新的模式下,我们能够创建自己的生态。这个生态是基于新交互的生态,这是我们为什么命名成OS的原因,就是它是一个开放赋能的平台生态。