据了解,百度“大脑”是通过深度学习来模拟人类大脑的神经元,参数规模达到百亿级别,成为目前世界上最大规模的深度神经网络,目前已具备2~3岁儿童智力水平。基于人工智能深度学习等技术打造的“对象识别方法和装置”专利技术也可以保证“神灯搜索”里所提及的多轮语音交互的实现。
在2014年,谷歌、百度、Facebook和IBM等科技公司在人工智能领域强势布局,并将这些技术应用到具体的产品和服务中。谷歌去年初收购DeepMind公司后推出了新的“模拟神经网络”,可以模仿人类大脑进行归纳整理等逻辑推理,甚至可以自行处理任务。
不过,在科技界中,特斯拉CEO Eron Musk(埃隆·马斯克)和霍金的“人工智能恶魔论”引发了激烈争论:当越来越聪明的“虚拟人工助手”来到我们身边,究竟是更像天使,还是更像恶魔?还要等待未来的检验。
语音交互 新型搜索第一步
“有事您说话!”新型的搜索,特别强化了语音交互的重要性。百度董事长兼首席执行官李彦宏曾经预测:“未来五年,使用语音和图像来表达需求的比例将超过50%”。
在语音交互这一方面,微软、苹果、谷歌Google Now等都已实现重要进展。国外有Nuance语音技术公司,苹果iPhone手机的虚拟语音助手Siri、谷歌的语音搜索服务、微软的必应;国内则是百度、科大讯飞等企业。
不过,“语音识别”的功能性对于类似“神灯”搜索这样的智能交互来说,意义重大。百度首席科学家吴恩达曾透露,通过使用“神经元系统”以及“数据燃料”,百度人工智能帮语音识别提高了准确性,语音识别可以很好地处理背景噪音,使手机离得比较远也能很好地识别用户讲出的话。
记者采访了解到,现阶段,一些模糊不清的词汇还是难以辨别,也不能通过语境理解用户的真正意图。拿“我要吃饭”这一句话来说,在中文里可能就有“我要点餐、我要吃夜宵、我要填饱肚子、我饿了”等的衍生表达。
“语音搜索”虽然现在已经实现了,但是要实现后续的多轮对话,一方面需要更加出色的语音智能交互技术,另一方面也需要背后人工智能技术以及整合服务等方面的强力支持。比如,在Siri搜索“我要吃饭”,它会从大众点评上获取信息为你推荐最近的餐馆,点击进去会有餐馆的简介和地理位置,但只限于信息的获取。