为什么人工智能还远不能取代人类?语言理解能力仍然欠缺

人工智能的决策网络第一层被设计用于在数据中识别一些最基本的模式,比如图像中某个物体的边界。随后这一结果被输入到第二层决策网络,后者将继续搜寻更为复杂的模式,如方形或者圆形。这一过程不断递进迭代,每一层决策网络都能够识别比上一层更加复杂的模式,于是随着时间推移,人工智能的模式识别能力不断提升,比如它能够借助低层次决策网络得到的机构外观信息最终准确地鉴别出一些物体,如一辆汽车或是一辆自行车。

威特森表示:“借助深度学习技术,你能够将海量数据输入一个大型神经网络,然后它自己就能完成从头到尾的自我训练。”

巨大的回报

这一技术的发展已经产生了一些拥有超人般能力的人工智能。赛尔曼表示深度学习系统已经被证明能够在医学核磁共振影像判读方面超越人类专家。另外还有一种技术被称为“增强学习”(reinforcement learning),该技术主要原理是机器通过奖励信号来不断修正自己的最优策略并不断进步的技术方法。加拿大人工智能初创公司“Maluuba”的首席技术官兼联合创始人卡希尔苏勒曼(Kaheer Suleman)表示,当将深度学习与增强学习两者相结合,机器还能够进行精确的虚拟仿真。谷歌公司的人工智能系统“阿尔法狗”正是通过自己与自己对弈超过数百万局,并不断总结这些对弈中学习到的方法,提升自己的技术与策略,从而迅速成为水平甚至能够击败人类最顶尖大师的围棋专家。

苏勒曼表示:“人工智能面临的重大挑战还在于那些缺乏大规模标记数据集的领域,或者难以对相关环境进行较好模拟的领域。”他说:“语言就是这种领域的一个很好例子。互联网上包含有无穷无尽的网页,但上面全都是文字,没有一个地方找得到以机器能够理解的形式所书写的关于这些文字‘意思’的内容。”

“Maluuba”公司目前正致力于开发一种算法,其能够阅读文字并回答关于这段文字的问题,但苏勒曼表示语言的一些特点让这项工作变得尤其困难。仅举一例,语言的复杂性难以想象某一段文字可以有不同深度上不同的意思,其中的每一个字、每一个词和每一句句子都有着各自的含义。这些不同的含义可以相互组成成近乎无限多的组合,而且不同的人使用语言的方式和风格又不一样。

除此之外,所有的语言都是抽象的:文字只是真实世界中事物的抽象标记,而所有这些真实世界中的事物对于机器来说都是它从未经历过的。威特森表示:“从机器学习的角度来看,学习完成后的机器水平也不过是和你输入其中的数据量所能提供的信息相当。”

由于缺乏对真实世界的体验数据以及人类社会已经积累起来的数量巨大的社会互动经验,很容易理解为为何微软公司的聊天机器人Tay无法很好地理解什么是“Holocaust”(大屠杀),以及为何否认它是一种不合适的行为。

未来发展

但尽管面临这样或是那样的挑战,Maluuba公司在上个月在论文预印本网站arXiv上贴出一篇论文,描述了该公司目前开发出的一款智能系统已经能够以大约70%的正确率阅读一篇它不熟悉的文章,并回答关于这段文章的多选题。这样的准确率水平已经超出同类其他系统最高水平15%以上。Maluuba公司研究人员所采用的技术方法结合了深度学习与神经网络结构,通过这两者之间的相互作用输出非常初级的推理结果。这家公司目前同样还致力于机器语音对话系统的开发,其设计目标是能够非常自然流畅地介入与人类之间的正常对话。

赛尔曼表示,未来在一些主题内容较为有限的领域,侧重语言能力的人工智能将拥有极大的应用前景。比如说一些技术支持热线在未来可能就将逐渐由人工智能代替,另外一些常规性的管理岗位,其职责主要就是升级一些表格并发送一些格式化的邮件,那么这样的工作就很可能可以由人工智能代替,并且它们或许可以做的更好。

赛尔曼说:“而在一些不受控制的,非常开放环境下的设置中,履行任务将需要借助人类智力的多种维度,并且需要你真正理解他人。在这样的领域,人工智能就会出现非常明显的局限性。”