「 粹客网 8 月 17 日快讯 」 目前 VR 环境的交互方式还是以手柄和控制器为主,同时也有不少创业团队正在进行手势控制技术的研发,但如果继续探索更深层次的人机交互方式,我们会发现语音识别对 VR 技术巨大的推动作用。近日 Unity 也在一篇博文中详细介绍了语音识别技术的相关信息,其中有大量讲述语音识别技术如何提升 VR 体验的理论内容。
语音识别的核心其实是人工智能,这也是它经过了长时间的发展至今仍旧不够成熟的原因之一。博文中对于语音识别的基本实现方式进行了深入的探讨,总的来说就是:“ 为了让人们感受到真实的 VR 体验,其中的人工智能(AI)系统要善于分析用户的语音指令并给予恰当的回应。”
想准确地完成语义分析,就需要 AI 系统从用户的言语中寻找到一些既定的模式,从而去理解它所代表的含义。原文中还提到,语音识别对于 AI 系统的深度学习能力有较高的要求,例如用户在长期使用的情况下,成熟的语音识别应用能够记住用户的语言模式,不仅能根据指令做出反应,还能预测他在特定情境下可能会说的话。
Unity 在深入分析其技术原理的同时,也试图投身该领域的实践研发之中—— 它制作了不少用于实现这一功能的语音识别和分析的工具,以及一些语音文本的转换方案。目前主要的研究成果是一个能将多种语音识别解决方案整合到 Unity C#脚本之中的工具包,其中包括一个用于比较文本转换结果的场景,用户可以通过朗读句子来判断它的准确度。
据了解,该工具包已经在 Asset Store 中免费提供,不过 Unity 表示,这一技术现在还处于比较基础的阶段,更多的目的还是让开发者们加深对语音识别技术的了解。“ 我们的 Asset Store 工具包目前只整合了少量语音文本转换工具,不过你已经可以用市面上最主流的解决方案来跟它比较,了解现有语音识别技术的优势和不足。”