Andrej Karpathy 知道和人工智能比赛时的感受。
他第一次和人工智能正面对抗是在 2011 年。当时斯坦福大学的一群研究人员刚刚制造出全世界效果最好的图像识别软件,而他想看看自己的大脑与他们的数字造物在进行标准图像识别测试时有多大优势。
斯坦福大学的软件分析了一个由近 5 万张图片组成的图片库,将每一张图片归为十类中的一类,如“狗”,“马”和“卡车”等。软件当时的识别准确度大约为 80%。Karpathy 进行了同样的测试,以 94% 的准确度完败人工智能。Karpathy是斯坦福大学的研究生,他以为在很长一段时间内,人类都能这类测试中胜过机器。Karpathy 在一篇提及人工智能算法的博文中说道:
“人工智能算法的准确度很难超过 80%,不过我猜还是可以将准确度提高到 85% 至 90%。”
但他错了。
去年,Google研究人员搭建了一个系统,在更复杂的ImageNet图像识别测试中达到93.4% 的准确度。Karpathy 与斯坦福大学的一些同事一道,又与这一系统进行了正面对抗。不过这次,他们的准确度在一开始只达到了 85%。
2011 年的测试并不能与 ImageNet 相提并论,但重要的是:人类在 2011 年能轻易地打败人工智能软件;现在却不行了。绝对没有希望获胜。
这个故事可以延伸很远,从Google到 Facebook,从 IBM 到百度,到处洋溢着对目前人工智能的兴奋之情。这些巨头都在一个名为深度学习的新兴领域投入巨资,深度学习是按照大脑积累知识的方式进行建模。自 2013 年以来,ImageNet 竞赛的冠军都是深度学习算法,而且其在语音识别、视频识别乃至金融分析中都有惊人表现。
加州大学伯克利分校教授、人工智能专家 Stuart Russell 表示,这让人工智能领域为之震动,因为以前人们长期认为不可能被计算机解决的问题突然被计算机解决了。
换言之,计算机还有很多东西要学。
人工智能训练营
Karpathy 及其同事被Google的系统完虐的原因之一是,ImageNet 处理狗等事物的方式。在 Karpathy 参加 2011 年的测试时,只有一个狗的类别。但在 2014 年,ImageNet需要你分辨出 200 种狗。
也就是说,Karpathy 必须知道罗得西亚脊背犬和匈牙利猎犬(这都什么狗...)之间的区别。
“当我看到所有这些狗的照片时,我的感觉是‘噢,不!在机器认出这张图片时,我还在忙着确认这只狗的品种’。”
因此,Karpathy 参加了自己制作的人工智能训练营,在这一过程中成了鉴定狗品种的小权威。两周后,在经过 50 个小时随机点击图片的培训和测试后,他赢了机器。Karpathy 在测试中的准确度达到了 94.9%,比Google的软件高 1.7%。
人类又胜利了一次,不过胜得并不轻松。Karpathy 表示道:
“比赛让我有点精疲力竭,但我觉得知道人类的准确度很重要。”
抽象思维
与此同时,Karpathy 及其同事希望人工智能可以提高。他们正在研究如何消除人工智能系统中的缺陷,在试图了解计算机的性能能否达到人类水平的同时,也在尝试分析它们的错误。
在测试时,如果出现抽象图片,Karpathy 基本上都能打败机器。比如,人类能立刻判断出一张图片上是不是描绘了弓。Karpathy 还能认出盐罐上的“salt shaker”字样,明白看到的东西,而计算机不是很擅长处理抽象事物。
计算机也不擅长识别 3D 图像。计算机也许能识别杰克罗素梗犬,但要测算其大小,或者弄清楚它与同一房间中其他物体的相对位置,就是另一码事了。这也是Google所梦寐以求解决的问题之一,他们希望计算机能像人类一样识别图片中的深度和微妙之处。
下一次,人类还能战胜人工智能吗?
via wired