要在你的朋友圈里找出一位没有看过《权力的游戏》的朋友是不是特别困难。这部由美国作家乔治·R·R·马丁所写的小说,经过HBO改编成电视剧后圈粉无数,甚至连人工智能系统也是它的粉丝。
加拿大人工智能初创公司Maluuba日前就推出了一款机器学习系统,可以让计算机像人类一样阅读文章,理解小说故事的情节。
不同于图片和声音识别技术,让机器正确理解人类知识和语言更加困难。这也是人工智能遇到的重大挑战之一。因为语言理解领域缺乏大规模标记数据集,机器学习时,很难对该领域的相关环境进行模拟。尽管互联网上包含无数的网页,上面拥有无数的文字内容,但还没有人能找到以机器能够理解的形式将内容输给机器。简单地说,机器还没有掌握人类学习知识的方法。
因此,让机器学会阅读理解人类语言是一个里程碑式事件,也是真正人工智能应该达到的目标。谷歌、Facebook和IBM等公司也在关注机器学习阅读理解能力。但从目前的测试结果看,这家加拿大的初创公司已经领先谷歌等巨头,走在了前面。
EpiReader对自然语言的理解超过谷歌、Facebook
Maluuba推出的系统名为EpiReader,研究人员设计这个系统的目的在于用来解决特定类型的理解任务。研究人员会将一段文字的默写字词抹去,EpiReader需要根据上下文语境来补全信息。据研究人员介绍,EpiReader使用了2层神经网络,这是一种模拟人类大脑神经元的计算机系统。第一层神经网络能让系统基于对于段落的理解挑选可能存在的答案,第二层神经网络用来评估第一层给出的答案,并最终给出一个正确的回答。
Maluuba用了大量的文本对EpiReader进行了测试。与去年谷歌DeepMind用CNN和《每日邮报》的30万篇新闻稿,Facebook用98本儿童经典读物做文本测试相比,EpiReader测试的文本数量更多,能让机器构建起词汇语义理解的框架。
从测试结果看,EpiReader在填空题中分别得到了74%和67.4%的准确率。根据《the Verge》的报道,国内许多人工智能的专家认为,这个测试结果是目前所有机器学习语义理解中的最高分,打败了谷歌的DeepMind,Facebook和IBM沃森在今年3月份公布的结果。
有趣的是,Maluuba还让EpiReader阅读了《权力的游戏》第5季中的部分章节,EpiReader阅读完后,迅速理解了故事内容。当工作人员问它,是谁刺死了John Snow(《权力的游戏》男主之一)时,机器直接给出了准确的回答:守夜人。现在如果你问苹果手机的Siri助手,它可能还完全不知道你在说什么,从而将你推到搜索网页来寻找答案。
除了《权力的游戏》,EpiReader还读过《哈利波特与魔法石》,也能正确回答研究人员提出的问题。
“这样的算法可以用到使用者手册、病人病例记录或者消费者服务的文件中。”Maluuba产品副总监Mohamed Musbah在接受《MIT科技评论》采访时说。
目前,该公司的产品已经运用到消费类电子产品和设备制造商上。比如,LG 旗舰G系列手机的voicemate应用就采用了Maluuba技术。2013年2月,Maluuba正式宣布向Windows Phone平台迁移。Maluuba的Windows Phone 8版本拥有 Android 版本的大部分功能,例如可以搜索餐馆、影院、新闻和企业(以及进行语音购物)、设置闹钟、提醒和会议安排、打电话、发短信和邮件、指示方向和天气,甚至还集成了Outlook日历。
虽然功能与Siri、微软的Cortana相似,但Maluuba的工作人员显然不愿意自己被一个领域里的助手角色束缚。他们的目标是能做出代替人类阅读的程序,人类以后可以借助EpiReader,在任何地方找到想要的书籍,得出答案。
比起人工智能的图像、语音识别,语义理解更有市场
“我们真的很想在EpiReader系统里融入人类更高的推理和阅读理解能力,融入我们思考世界的方式。” Maluuba研发总监Adam Trischler在接受媒体采访时说。
Maluuba成立于2011年8月份,目前,公司在加拿大的蒙特利尔和滑铁卢两个地方设有研发实验室。这两个地方也是加拿大人工智能发展的重镇。公司大部分的研究人员来自蒙特利尔大学和加拿大滑铁卢大学,两个学校在计算机和深度学习两个领域里的学术成就,闻名世界。
2015年8月,Maluuba 融资900万加元(A轮)用于进一步推进深度学习研究。同年12 月,Maluuba在蒙特利尔开设了一个新的研发实验室。其中有13名深度学习方向的研究人员。据Maluuba官网介绍,公司关注机器学习中的两个细分研究领域:对话和机器理解。同时,也关心研发解决通用问题的人工智能,对解决真实世界问题更感兴趣。他们相信自己能找出更好的人机交互方式。
“这种技术在未来可以接入用户所有的交互过程中。”蒙特利尔大学机器学习算法研究所负责人,同时也是Maluuba的顾问Yoshua Bengio教授在接受《the Verge》采访时说,“Maluuba的技术非常特别,理解别人说什么、写什么,这个潜在的市场非常巨大,甚至比计算机视觉处理还大。我认为,这是我们如何与计算机交互的方式,未来它会无处不在。”