《连线》(Wired)网站日前发表文章称,虽然 任何足够先进的技术都与魔法无异 ,但当前的深度学习(Deep learning)技术还远未达到 魔法 的程度。
谷歌人工智能(AI)应用AlphaGo战胜李世石让全世界感到惊叹,一些行业权威人士也因此将深度学习技术吹嘘成 人脑模拟 。但事实上,机器学习还远不是一个将从魔瓶里被放出的 妖怪 。它只是一种数学算法,是人类在理解智能、建立与人类水平相当的AI过程中向前迈出的一步。
深度学习就是数学计算
深度学习正在迅速 吞噬 AI,但不要把这种方兴未艾的AI技术夸大其词。英国知名作家亚瑟 克拉克(Arthur C. Clarke)曾经说过: 任何足够先进的技术都与魔法无异。 深度学习当然是一种先进技术,它能识别图片中的物体和人脸,识别语音内容,将一种语言翻译成另一种语言,甚至还能在围棋比赛中战胜人类顶尖高手。但是,深度学习还没达到 魔法 的程度。
随着谷歌、Facebook和微软等科技巨头继续将该技术整合到日常在线服务中,以及全世界仍在为谷歌AlphaGo战胜李世石而感到惊叹之际,一些行业权威人士开始将深度学习技术吹嘘成 人脑模拟 。其实,机器学习就是简单的数学计算,只不过计算规模庞大而已。
事实上,深度计算就是一种算法,基于数据来调整神经网络。那么这句话到底是何含义呢?让我们来解释一下:一个神经网络就是一个计算机程序(受大脑结构而启发),它包括大量彼此连接的节点(或称 神经元 ),每个节点都会对接收到的数值输入进行简单的函数计算(如求和)。这里的 节点 远比大脑神经元要简单,其数量也远低于大脑神经元的数量。深度学习只是强化了神经网络中的这些节点的连接。
深度学习是机器学习的一个子域,机器学习是AI领域里一个非常活跃的研究分支。理论上讲,机器学习就是基于数据点收集的一种逼近函数(approximating functions)方法。例如,如果一组数字排列是 2、4、6 ,那么机器就能预测出第四个数字应该是 8 ,第五个数字应该是 10 。计算公式就是2X,X代表排序中的位置。这种算法的应用空间很广泛,例如,在自动驾驶汽车、语音识别和预测机票价格波动等方面均有出色表现。
在某种意义上讲,深度学习不是独一无二、无规律可寻的。任何机器学习系统,无论是否属于 深度 学习,都由下列一些基本要素组成:
1.执行元素:系统中采取行动的部分。例如,在围棋比赛中负责走棋的部分。
2.目标函数:被学习的函数。例如,围棋比赛中棋盘位置或走子选择的映射。
3.训练数据:一套被标记的数据点集合,用于逼近目标函数。例如,围棋比赛中棋盘位置的集合,其中每一个位置都标注了人类专家在该位置上的走子选择。
4.数据表现:每个数据点通常会被表示为一个预先确定的变量的矢量。例如,围棋盘上每个棋子的位置。
5.学习算法:基于训练数据计算目标函数近似值的算法。
6.假设空间:学习算法可能考虑的函数的空间。
这种结构能适应所有取机器学习方法,包括从简单的线性回归方法到复杂的深度学习算法等。从技术上讲,我们指的正是监督学习(supervised learning),其中每个数据点都有人类做出的标记。如数据没有被标记,就是无监督学习,处理起来就要困难许多。如果有部分数据被标记,则属于半监督学习。
需要指出的是,机器学习架构中前五个部分都是人工输入的,意识到这一点很重要。人类程序员建构了其中每个元素,但并未控制机器学习程序。事实上,程序员通常会分析这个学习程序的行为,发现它不够完美之后,会手动修改其中一个或多个元素。这是一项非常艰苦的工作,在达到期望水平之前,可能需要几年、甚至更长时间的重复工作。
帮助人类
我们会发现,一个学习程序的能力会受到这种架构的严格限制。确切而言: