Unity 深入探索语音交互领域，为 VR 开发者提供语音识别脚本_前沿技术_物联网_中国计算网——工业互联网一站式服务平台—

　　「粹客网 8 月 17 日快讯」目前 VR 环境的交互方式还是以手柄和控制器为主，同时也有不少创业团队正在进行手势控制技术的研发，但如果继续探索更深层次的人机交互方式，我们会发现语音识别对 VR 技术巨大的推动作用。近日 Unity 也在一篇博文中详细介绍了语音识别技术的相关信息，其中有大量讲述语音识别技术如何提升 VR 体验的理论内容。

　　语音识别的核心其实是人工智能，这也是它经过了长时间的发展至今仍旧不够成熟的原因之一。博文中对于语音识别的基本实现方式进行了深入的探讨，总的来说就是：“ 为了让人们感受到真实的 VR 体验，其中的人工智能(AI)系统要善于分析用户的语音指令并给予恰当的回应。”

　　想准确地完成语义分析，就需要 AI 系统从用户的言语中寻找到一些既定的模式，从而去理解它所代表的含义。原文中还提到，语音识别对于 AI 系统的深度学习能力有较高的要求，例如用户在长期使用的情况下，成熟的语音识别应用能够记住用户的语言模式，不仅能根据指令做出反应，还能预测他在特定情境下可能会说的话。

　　Unity 在深入分析其技术原理的同时，也试图投身该领域的实践研发之中—— 它制作了不少用于实现这一功能的语音识别和分析的工具，以及一些语音文本的转换方案。目前主要的研究成果是一个能将多种语音识别解决方案整合到 Unity C#脚本之中的工具包，其中包括一个用于比较文本转换结果的场景，用户可以通过朗读句子来判断它的准确度。

　　据了解，该工具包已经在 Asset Store 中免费提供，不过 Unity 表示，这一技术现在还处于比较基础的阶段，更多的目的还是让开发者们加深对语音识别技术的了解。“ 我们的 Asset Store 工具包目前只整合了少量语音文本转换工具，不过你已经可以用市面上最主流的解决方案来跟它比较，了解现有语音识别技术的优势和不足。”