与“家”同等重要的语音场景非汽车莫属:车主在驾驶时双眼和双手都被占用,语音成为最佳输入方式。过去汽车内的语音输入存在许多痛点,自带语音功能只支持少数英文命令,并且还要给更多钱买“豪华版”才会配置。汽车内的语音交互充满着互联网巨头最向往的颠覆机会。
搜狗针对汽车发布了智能语音导航App,可实现驾驶之外的常规车内交互,包括打电话、发短信、查天气、歌曲播放等等,这款产品可运行在智能手机上,还可通过车机互联协议使之运行于汽车屏幕,如果汽车厂商与搜狗进行前装合作则可独立运行于汽车的OS上。不久前,YunOS与上汽合作的国内首款互联网汽车,语音交互被当做一个卖点:阿里巴巴CEO张勇展示了用语音打开天窗这样的操作。在未来,汽车内的语音交互将成为标配。
智能技术确保语音能够听得懂
Siri才五年历史,但语音却有十分悠久的历史:科大讯飞在1999年就已成立,现在是A股市场上市值400亿元的语音巨头。不过,语音走向大众,彻底改变人机交互方式,却是近几年才发生的事情。从国内外科技巨头的动作来看,智能技术和云端服务已成为语音的两大支柱。
语音技术过去是基于“规则”而不是“统计”,基于一定规则,对海量的语料库进行处理之后就能不断提高识别准确率。深度学习为基础的人工智能技术加入之后,语音技术就变成通过机器集群去学习海量语料数据,并寻找到各种规律,进而进行准确的语音识别和语义理解。
不论是语音输入的智能纠错,还是语音搜索对用户请求的准确理解,抑或Siri响应用户诸如“帮我设置一个提醒,明天9:00取快递”这样的复杂命令,底层均是人工智能技术,AlphaGo掀起的AI启蒙运动则将会成为语音普及的助力。
搜狗与清华大学联合成立“天工智能实验室”,正在人工智能技术这个“根”上布局,以求赢在起跑线上。借助于人工智能技术,搜狗宣称语音识别准确率高于97%,识别速度高达每分钟400字以上,在语音修改方面,支持替换、插入、删除等几百种改错操作 ,修改成功率达到90%以上,处于行业领先水平。
云端服务则决定语音能够做什么
智能技术确保了人与机器能够顺畅地对话和交互。云端服务整合能力,则决定机器在听懂人话之后能做什么。
Siri相比Google Now的劣势是,许多Siri无法回答的问题,Google Now可通过搜索解决。Amazon Echo之所以有很大价值,在于其能够去Amazon网站下单购物。这些均体现了云端的服务整合能力,正是意识到这一点的重要性,今年的WWDC上苹果决定开放Siri给开发者,让开发者来丰富Siri的服务。
云端服务上,搜狗拥有搜狗地图、搜狗搜索、搜狗号码通、搜狗问问、搜狗百科等产品,未来搜狗语音还可整合其伙伴如京东、知乎、腾讯的诸多服务,比如QQ音乐、腾讯视频、京东购物等等,甚至用语音给微信好友点个赞。相对来说,互联网巨头云端服务整合能力更强,搜索引擎凭借着强大的内容整合和服务连接能力表现又更突出。
仅仅是整合“在线服务”并不足够,互联网巨头要做语音,下一步重点将是努力去与实体世界服务实现整合,比如让用户能够通过语音订外卖,可以通过语音打开门禁,通过语音来打开车窗……整合方式有两种方向:一种是手机App与各种服务连接起来;还有一种是语音inside各种硬件之中,例如机器人,汽车等等。总之,整合实体世界服务之后,语音就不会只是回答用户的问题,而是要帮助用户完成任务,成为全能助理。
语音市场在AlphaGo掀起人工智能热潮之后又迎来新的发展契机,语音正在彻底颠覆人与机器的交互方式,百度和搜狗为代表的中国科技巨头正在输入、汽车等场景上寻求突破,在智能技术和云端服务上进行双重布局。不过,要让麦克风取代键盘,科技巨头还有很长的路要走,可谓任重道远。
登陆|注册欢迎登陆本站,认识更多朋友,获得更多精彩内容推荐!