人工智能学习方式越像人越不靠谱

据《连线》杂志报道,神经网络正风靡整个硅谷,无数的互联网服务中嵌入各种各样的人工智能(AI)。令人感到激动的是,最好的AI已经可以识别网络照片中的猫咪。但AI研究人员知道,神经网络依然存在许多缺陷。实际上,它们的缺陷非常多,以至于有些人怀疑这些模式识别系统是否是实现AI的可行、可靠方式。

神经网络可以通过分析大量数据来学习和了解任务,比如帮助Facebook进行面部识别、帮助微软进行翻译、帮助谷歌进行互联网搜索等。它们甚至已经开始帮助聊天机器人学习对话艺术。它们正成为无人驾驶汽车和其他自动化机器的重要组成部分。但是在没有大量经过仔细标注的数据的帮助下,它们就无法理解世界的意义,它们不适合执行任何任务。AI研究人员很想知道,为何神经网络在做出具体决定时受到如此多的限制?在很多情况下,它们实际上就是“黑盒子”。这种不透明会引发严重问题:如果无人驾驶汽车向着某人撞去,结果会如何?

卡内基梅隆大学计算机学教授、帮助开发顶级扑克人工智能系统Lipatus的托马斯桑德霍尔姆(Tuomas Sandholm)说:“深度学习已经受到许多关注,它当之无愧。但是深度学习并不能给你提供任何保证。”这是真的,但也正是因为神经网络存在这些明显弱点,许多世界上最大的科技公司正在扩展它们的AI思维,从最近的招聘、收购、研究动向中作出判断,许多初创企业也正涌往相同的方向。

你可能认为这是贝叶斯算法(bayesian)的崛起,这类研究人员通常以科学方法研究AI,他们最初从假设开始,然后基于数据更新这个假设,而非像人经网络那样依赖数据去驱动结论。贝叶斯算法的研究人员寻找处理不确定性的方法,将新的证据输入到现有模型中,可以执行神经网络不擅长的工作。

与神经网络相似的是,贝叶斯算法也可以通过数据进行学习,但是这种机器学习可通过不同的方式进行。AI初创企业Gamalon创始人本魏格达(Ben Vigoda)说:“令我们感兴趣的是自动化科学方法。”他的公司正通过所谓的“概率规划”计划推动这种趋势。

这再次提醒我们,神经网络的快速崛起也将生命注入到许多其他技术中,这些技术可帮助机器变得更加聪明,从强化学习到进化计算等。有许多方法,可以帮助机器进行学习。

神秘技术

2016年12月份,当加里马库斯(Gary Marcus)将15人的初创企业卖给Uber时,他带着全新的AI到来。至少他是那样说的。他的公司叫做几何智能(Geometric Intelligence),一个小小的操作就能做出巨大改变。这位现年47岁的纽约大学心理学教授说,他与同事们正在开发能够从很少数据中学习任务的系统,这与人类十分相似,同时超越了深度神经网络的力量。

马库斯认为,小数据系统是建造机器必不可少的部分。这些机器可自主进行交谈,汽车也可以自己在公路上行驶。当Uber宣布收购Geometric Intelligence时,马库斯说:“在语言领域和无人驾驶汽车领域,你永远不会有足够数据像深度学习那样产生野蛮之力,这会产生许多问题。毕竟,你不能在繁忙的公路上撞车以便数据,用以预防将来发生车祸。你也不能购买它,它根本不存在。”

马库斯和他的联合创始人、剑桥大学信息工程学教授左斌加拉玛尼(Zoubin Ghahramani)依然没有探讨他们正在开发的技术的具体细节。就像技术界常见的情况,特别是AI领域,这种保密性通常会催生“神秘感”。但是加拉玛尼是贝叶斯算法的支持者之一。他专门从事名为“高斯过程(Gaussian process)”的特殊统计模型,而这种模型在马库斯开发的技术中发挥了重要作用。

高斯过程

在某种层次上,高斯过程是寻找特定问题最优解决方案的方式。同时,它也是另一种名为贝叶斯优化的数学技术的基矗到目前为止,高斯过程已经帮助网站确定应该显示哪些广告,以及它们的网页应该如何排版。Uber已经招募擅长高斯过程的专家,改善其拼车服务。在谷歌,高斯过程帮助控制该公司的高空联网气球。