深度学习:远非人工智能的全部和未来

深度学习

现在每一个人都在学习,或者正打算学习深度学习(DL),它是目前人工智能诸多流派中唯一兴起的一个。各个年龄阶段的数十万人学习着免费和收费的深度学习课程。太多的创业公司和产品的命名以「深度」开头,深度学习已然成了一个流行语,但其真正使用实际上很少。绝大多数人忽略了深度学习只占机器学习领域的 1%,而机器学习又只占到了人工智能领域的 1%。余下的 99% 则被用来处理实践中的绝大多数任务。一个深度学习专家无法与人工智能专家划上等号。

深度学习并不是人工智能的同义词。谷歌、Facebook 等巨头公司宣传最多的人工智能工具主要是或者仅仅是深度学习,因此大众误以为所有的人工智能突破都(将)由深度学习实现。真实情况并非如此。决策树比如 XGBoost 不会成为头条,但却在很多 Kaggle 表格数据竞赛中低调地击败了深度学习。媒体暗示 AlphaGo 的成功全部归于深度学习,但实际上它是蒙特卡洛树搜索+深度学习,这表明深度学习单枪匹马很难取胜。很多强化学习的任务通过神经进化的 NEAT 而不是反向传播得到解决。人工智能领域存在着「深度误传」(deep misinformation)。

我并不是说深度学习没有解决问题:它令人印象深刻。树和其他算法并没有完胜深度学习,某些任务上深度学习无法被取代,但是我希望未来一些非深度学习系统可被(重新)发现以击败深度学习,并解决了目前无法解释的黑箱问题。同样我也希望读到有关「灾难性遗忘」的深度学习文章,它是指在学习新知识时快速遗忘先前已学习知识的倾向,并且需要每天对抗「过拟合」。关于「智能」:深度学习只是简单地相信给到的训练数据,而不管什么是真与假,现实与想象,公平与不公。人类也会误信假新闻,但只是在某种程度上,甚至孩童都知道电影是虚构的、不真实的。

关于更多细节,如果你有时间了解,请见我的详述文章:https://www.linkedin.com/pulse/ai-deep-learning-explained-simply-fabio-ciucci。

20 年前,每个人都在学习 HTML,这个手动写网页的标记语言当时被认为足以成就一个亿万富翁。我学习每一项看起来有用的技术,如 HTML、手机 app 和深度学习,并且邀请其他人一些学习。事实上,你一生中不是只学习一次技术。1995 年 HTML 开始过时,无法满足需求,取而代之的是 CSS、JavaScript 和服务器语言。同样地,深度学习有一天也会过时。大多数流行的手机 APP 根本用不到 HTML,那么,谁又会知道未来的人工智能 APP 用不用得到深度学习呢?

实际上,深度学习是 1980 年代的技术,比 HTML 还老:由于有了更多的训练数据,1970 年代的「带有隐藏层的神经网络」获得新生,重新命名为深度学习之后被大肆炒作。1992 年我扼要地查看了神经网络以及分形分析(fractal)和细胞自动机的源代码。正如绝大多数人一样,当时我并没有选择深度学习,只是把它当作毫无实际价值的学术数学难题。相反,我聚焦于视频游戏的 3D 技术,因为它可以即刻获得结果;后来我又开始关注互联网等。但是我们都错了,深度学习借助大数据可以大有作为。2015 年 Deep Dream 简直令我着迷,接着是 GANs 等。但是,深度学习并不是人类可以创造的人工智能科技的终点。

数十年来,「古老」的深度学习技术已被广泛研究和更新以更准确地解决更多任务,但是没有一个深度学习网络(卷积、RNN、RNN + LSTM、GANs 等)可以解释其自身的决策。无疑深度学习还会解决更多的问题,取代更多的工作,但不太可能解决所有的问题,或者保持惊人的进步以自我解决黑箱问题或者为之正名。

哲学家

哲学家柏拉图与亚里士多德:深度学习无法理解他们

未来人工智能应探索其他的新方法,或者已存在却被忽视的方法,而不仅仅是深度学习。深度学习的一个局限是把数据中最常遇见的内容作为真理,把统计学上较稀少的东西看作假的。深度学习的公正性并非来自其自身,而是人类筛选和准备的数据。深度学习可以阅读并翻译文本,但不是以人类的方式。如果使用超过 100 本书训练深度学习模型:40 本书告诉仇恨、战争、死亡和摧毁如何是坏的,60 本书告诉希特勒的纳粹思想是好的,那么该模型最终会成为 100% 的纳粹!