We are“伐木累” 声控智能家居必过5关

  让智能设备适应每个人的使用习惯可能吗?答案是肯定的。这里要用的到就是语音识别的另外一项关键技术—个性化识别技术。个性化识别指的是语音识别系统具备自动学习并适应用户使用习惯的能力,你用的越多,它越懂你。一般来说,个性化识别包括发音和语言两方面。其中发音个性化主要是指系统对用户语速、口音等发音习惯的学习,而语言个性化主要是指系统可以对用户的特定词汇(例如人名、地名、口头禅、专业词汇等)具备更好的辨识性。

  目前业内成熟的个性化识别技术已能针对每个人的兴趣点、知识背景等来进行个性化语言模型建模,从而准确识别出个性化的词汇内容。以后你用的越多,语音识别系统就会越懂你。

  四、方言:普通话标不标 zun 也照样能用

  众所周知,中国的语音及语言博大精深,虽然国家在推广标准普通话方面不遗余力,但是中国真正掌握标准普通话的人群比例还是比较低的,而中国的口音现象则是纷繁复杂,甚至会出现同城市中都有不同口音的情况。因此,当这些带有或轻或重口音的人群在使用语音输入时,如果按通常的方法使用标准普通话数据进行模型的训练,就会产生很严重的适配问题,从而影响语音输入时的识别效果。

  「方言」现在也不再是语音识别的障碍,得益于各类方言丰富的音频数据、特殊词汇、发音现象等专业资源以及充分利用深度神经网络的自学习特色,目前,讯飞输入法已经陆续支持四川话、河南话、东北话、天津话等 15 种方言识别,这些方言识别能力同样适用于智能家居环境中。以后,无论你使用普通话还是方言,无论你说话语速快还是慢,普通话标不标 zun,在家里都能自由地使用语音控制智能设备。

  五、语音唤醒:真正解放双手

  由于功耗等方面的限制,智能设备很难 24 小时都保持在激活状态。因此,要想在家里自由地控制智能家居设备,我们还需要能即时「唤醒」功能,也就是给智能设备加入「语音唤醒」技术。

  语音唤醒,是指通过含有特定唤醒词的语音输入来「触发」语音识别系统以实现后续的语音交互。通过该技术,任何人在任何环境、任何时间,无论是近场(0.5 米以内)还是远场(2~5 米),面向设备直接说出预设的唤醒词,就能激活产品的识别引擎,从而真正实现全程无触控的语音交互。

  除了说单个唤醒词实现唤醒外,更自然便捷、在技术上更具有挑战性的交互方式是在连续语流中带上唤醒词,以实现唤醒产品并同时实现操控的效果,比如直接在语音助手中说出「打电话给张三」就可以唤醒设备并自动完成人名识别与拨打电话。

 

  随着语音识别技术在距离、效率、个性化、方言、唤醒等多方面一一突破实用瓶颈,随心所欲「声」控智能家居的时代一触即发,那么这一变革多久会来?也许在明年,也许就在明天。