昨天外媒传出,终于有一个计算机程序首次成功通过了图灵测试。这是一次属于计算机的胜利,一次颇具争议的胜利。依然有很多人站出来说,这并不算什么稀奇的事,毕竟通过比例只有 30%,而 Eugene 只取得了 3 个百分点高值。
那么究竟 Eugene 通过了图灵测试代表了什么?对计算机,乃至对于人类意义有多大?来和我们一探究竟吧!
-
什么程序?
俄罗斯人 Vladimir Veselov 在俄罗斯的圣彼得堡开发的人工智能软件「Eugene」,通过了原版图灵测试。该软件模仿一个十三岁的小男孩,在回答图灵测试的测试者提出的问题时被认为其 33% 的答案是由人类给出的,而图灵测试的规则是如果这个比例超过 30% 即算通过。
这是「计算机之父」阿兰·图灵(Alan Turing)在 1950 年提出图灵测试理念之后首次有计算机控制的程序通过了该测试。经过了 64 年!里程碑式的事件!
-
那什么是图灵测试?
好问题。看来非常多的人对于图灵测试所具有的重大意义还是不太了解,或产生了根本性的混淆。
图灵测试的目的是用来测试它的测试对象——机器,是否达到了人工智能或人类感知的水平。当然,测试对象并不是《终结者》当中的天网那样的超级计算机系统。用最简单的话来描述的话,图灵测试的意义在评判一台机器是否能够成功的模仿人类。
跟 Siri 聊过天吗?如果你用过 WP 手机,你也一定觉得 Cortana 的智能水平已经非常不错了。图灵测试的通过标准线——30% 的问题答案被认为是人类回答——在很多人看来非常低。而事实上,能够通过图灵测试的人工智能系统,要比《全民公敌》(I,Robot)当中的机器人还要聪明和智能。
-
好吧,那为什么这次 Eugene 的胜利引起了这么大争议?
图灵测试本身并不是一个严格的针对计算机的测试,因为题目是由人提供,由人提问,由人判断答案的「类人性」的。聊天机器人有时候模仿人模仿的太像,以至于图灵测试的某些上了年纪的测试员也会相信他们的「鬼话」……
当然,这并不是说聊天机器人都能够轻易蒙混过关。图灵测试的测试员通常来自世界计算机科学界的顶尖科研人员。不过本次测试的审核委员会中,还有包括了著名科幻喜剧《红矮星号》的演员 Robert Llewellyn 和 英国上院议员,自民党人士 Lord Sharkey。后面这两位尽管都是在文学、科技界声名显赫的「话题」人士,但对于人工智能方面的了解却并不能算「够资格」。
Eugene 通过图灵测试的方式也非常非常之取巧——既不是牛津大学的教授,也不是普通人,而是使用了一名十来岁男孩作为模仿对象——人类正常对话沟通的底限年龄。而且,还是一名讲俄语的男孩(英语是第二语言)。
也就是说,Eugene 本次通过图灵测试,前提条件太多,大大降低了通过的难度,提高了可能性。是为很多人所不齿的一次胜利……
-
说了这么多,我们到底该不该关心这件事啊?
是这样的:即便如上所言,Eugene 也的确是通过了严格且科学的整个图灵测试的流程。Eugene 并不是第一个试图用投机取巧的方法来通过测试的聊天机器人,但的确是第一个真的通过了测试的。尽管 Eugene 面对的本次审核委员会并不能称得上是学术和研究经验最深厚的一拨人,但大部分的聊天机器人也不是用来专门跟计算机专家对话的呀!
因此,Eugene 通过图灵测试,的确是人工智能方面的一次重大突破。你应该为之感到……不管是激动还是恐惧,但至少不是怀疑。
如果你非要怀疑,那就怀疑图灵测试本身吧:这是一个主观、门槛够低,但仍然是人工智能业界的第一标准的一套测试工具。质疑 Eugene 为什么胜利就像是质疑足球赛的球门为什么那样宽一样……不是机器人的问题,而是游戏规则的问题。
-
那么现在该咋办?
别太担心,像终结者那样的智能机器人不会明天就出现在你家的门口,准备谋杀你。但 Eugene 通过图灵测试的事实,预示了我们距离能够被计算机模拟出的人工智能蒙混过关的日子越来越近了——即便他们装成了一个母语是俄语的 13 岁小男孩。
思想有多远,聊天机器人就能走多远。未来会出现能陪聊的机器人、能卖东西的机器人、能做爱的机器人,或者能陪聊还能做爱还能卖东西的机器人……
更重要的是,或许我们终于可以宣布把图灵测试放在过去,开始面对新的人工智能世界——天网和终结者了。