2016年8月,美的智能空调发布,它搭载了云知声的AI芯,使用者可以在家庭环境中5米内通过语音控制空调的开关和温度,空调能结合关键词分析、理解用户意图。
但这款产品的问世也是历经挑战。要想获得厂商的合作支持,就必须能够消除噪声环境影响实现语音控制;空调一般都是壁挂式,所以要实现远场交互;且成本可控。
“Echo是7+1个麦克风,外圈7个和中间1个,所以它效果不错。但我不行,家电厂商对成本是非常在意的。”黄伟说。“麦克风多了,信息源多,就需要更强的CPU,成本功耗就要提升。其次,家电大多是靠墙安装的,麦克风怎么放?”
云知声最后采用的是双麦克解决方案,两个麦克风,间距不超过3厘米。但问题又来了,只有两个麦克,如何达到性能?云知声花了一年多时间解决这个技术问题,终于在2015年这款产品开始生产。现在,市场上的大多数智能家电产品,华帝、格力、海尔、美的等,都是和云知声合作的。
但软件可解决,硬件也还是让黄伟觉得比较麻烦的一件事。比如麦克风。“现在手机上的麦克风,对电话场景下的噪音意识,已经做得非常好了。但在家居市场上,硬件厂商还没有这个意识。比如他们以前从来不会想到,一台电冰箱上会需要一个麦克风。所以,现在对我们软件的要求就更高了。”
除了智能家电和家居,车载以及医疗、教育等行业,也是云知声商业化落地的主要领域。比起智能家居来,车载的应用场景更好想象。当人们在驾驶时,双手都被占用,语音交互就成了最佳选择。但黄伟认为,车载前端产品周期非常长,“从接触到产品要出来差不多要用5年左右时间,不适合一个创业公司”。因此,云知声选择从后装市场切入。而2014年,黄伟认为是一个新的契机正在出现:“当时已经有10%的设备开始使用安卓平台了。我们判断,安卓在车载系统里将是未来的趋势。”经过了半年多的研发,到2015年中,云知声开始和厂商对接。到现在,安卓系统已经占据了市场上90%的份额,而目前,搭载云知声智能语音SDK的车机产品出货量已超过150万台。
在医疗方面,协和医院已经和云知声合作,使用医疗语音识别系统,对病历、医嘱等进行录入。而且,这也有助于未来的医疗大数据挖掘工作。
在商业化的策略上,云知声一直选择的是B2B2C。这也是很多AI公司的选择。当一种新技术仍在发展和完善过程中,通过与B端的合作,不断获取用户的需求,了解行业,通过反复迭代来完善技术,是看似必然的选择。而B端的企业,也是在技术投入成本较大的现阶段,比C端更具备付费与创新的动力。
之前,云知声的合作公司还多数是互联网公司的中小型企业,而从2016年开始,公司的商业重心开始向大B倾斜。“对于中小型公司而言,新的技术和交互形态它们更乐于去尝试。而大企业的推动进程也比较慢。而今年,很多大的企业的生产计划也可以排好了。”而和大型企业合作,对云知声而言,既能扩大市场规模,又能树立起行业中的标杆。
“做商业公司,一定得回归到商业本质上,那就是收入。尤其是像今天资本市场并不是特别好的情况下,大家更看重收入。但我们并不是到B为止了,我们还会到C。我们为什么要做平台?C端对我们具有用户价值,这能帮助我们的后台不断提升,在B端会更有持续的竞争力。”黄伟说。

云知声医疗语音识别系统的应用/受访者供图
让机器去理解人类
而这样用语音操控机器,或者机械的一问一答,还是远远达不到“智能”的程度的。开发者们需要去做的,是让它们更加聪明。
如果你坐进自己的爱车,感觉到今天的温度有些低,于是你说:今天有些冷。而这时,你车内的系统会自动将空调温度调高。再或者,当你和你的机器人在户外,你仍然随口表示:今天有些冷。而机器人,会自动理解你的意思,但此时,它不会去寻找空调,而是提示你:披上外套吧。这样的,是不是更令人向往的一个美好未来?
今年7月,云知声宣布,完成了技术引擎3.0版本的升级,并提出了“语用计算”的概念。关于这个概念,你可以简单地理解成,机器可以理解我们对话的语境,联系上下文进行回答。