提问:今天最开始在宣传片里面,大家说现在这个技术是基于Android或者是Linux的,是我看错了吗?
景鲲:你可以这样想,原来那些系统都是上一代的,是一个底层的系统,并不是那么关心交互的。DuerOS其实是以用户交互为驱动的一个操作系统。移动时代跟原来的PC有很多不一样,AI技术跟原来的不一样,AI的设备也很多样。这种多样的情况下,DuerOS要做的就是通过语音交互,把用户统一在一起。虽然设备很不一样,但是都用一个交互统一在一起。这是DuerOS要绑定的关系。其他的OS我把它看成是我们原来的系统适配层,适配到原来传统的OS。但是DuerOS是一个语音交互的平台,更上层一些。
提问:刚刚说到开发者,类似于DuerOS上面有100个Skills这种概念,这些Skills是开发者贡献来的还是你们自己?
景鲲:我们有自己100个原生的。现在有很多开发者,作为我们前期的尝鲜者,他们在我们的平台上搭建了100多个第三方的Skills。
提问:原生的是100个,还有100个开发者的?
景鲲:对,第三方的。
提问:我来自界面。跟厂商合作的时候,您了解到他们会比较看重哪些指标?因为我发现有些厂商后来更换了百度的系统,不知道有没有什么具体的一些策略?要做一个设备的Android系统,现在已经到哪一步了,您觉得还差什么?
景鲲:设备厂商现在最关注听懂和满足,如果用原来的核心三要素:听清、听懂和满足,现在设备厂商最关心听懂和满足。很多智能音箱可能觉得有点傻,交互不是那么自然,问它东西它不懂。所以现在这一块是我们的合作伙伴最关心的。其实这一块是老百姓最关心的。老百姓不关心你这三个模块,老百姓最关心我随便问你一句话,你真正能懂我,给我一个东西。所以听懂和满足,是所有合作厂商现在最关心的。
提问:都是技术层面是吗?
景鲲:满足有点像资源丰富度的层面,听懂是技术层面,就是有大家Query能听懂。我们最近做的渡鸦设备,它在听懂层面上是远远超过其他竞品的,所以我们把它定位为标杆设备,或者是智能硬件设备。我觉得发展到现在,我们需要探索如何做一个最好的产品体验。现在大家都有点Follow美国Echo的路线,就是他们怎么做我们怎么做。我觉得我们要做世界级的DuerOS。人机交互在美国也是很初期的,尤其在中国的场景里面,中国的家庭环境比较小,美国是大房子,中国是小房子,我们都是一居室、两居室、三居室的房间,什么样的交互是好的交互,多快的交互是好的交互?这些需要很多的探索。今天下午发布的百度人工智能交互设计院会在12月份发布行业里面第一个很有价值的报告,就是智能音箱的交互多快是快,多快是好。像这些东西,大家如果不关注用户体验,都不会看到这种细节,就会觉得现在Echo这个就是好,之前从媒体上我们都没看到你们写过智能音箱多快是好。
提问:1.5秒?
景鲲:我们现在基本上是1.25秒到1.4秒。现在讲的极致的最好的是650毫秒。如果再快,在现在来讲,用户会觉得虽然你很智能,但有点抢话。就像这样一个小问题,原来我们做搜索引擎的时候觉得越快越好,但是在这种新的人机交互上来讲,你会发现有很多原来的认知都会有变化。所以我觉得在细节上,已经做了很多了。比如现在的智能音箱,你叫它一声,现在有的不出声,亮一个灯,有的音箱是你叫它一声、它“叮”响一声,有的音箱你叫它一声,它回复“唉”,用人声回复。我们发现,你在不同的时间点按,用不同的交互都是好的。1.4秒以后用人声会好一点,人会觉得慢一点,人反馈会好一点。1.4秒以内用人声回复,就会增强那种抢话的感觉,这个时候用“叮”一声更合适。这个声音跟人声是不一样的,可能不用人声回答。再往前,Alexa就是指示灯,没有声音,不同的时间用不同的交互。我们在这个方面花了很多的时间,探索怎么能够让产品体验最好。回答你刚才的问题,还是把用户体验做对。把每个设备在每个场景里面的用户体验做对,现在是最重要的。
主持人:谢谢各位媒体朋友,如果有什么问题的话可以随时再联系,感谢大家!