Ray Kurzweil专访:对Google的搜索革命计划


当Google宣布 Ray Kurzweil 要加盟该公司时,许多人都在揣摩为什么这么一位现象级的成功创业家、未来学家愿意屈身一家不是自己创办的大公司?

Kurzweil的答案是:只有Google才能提供他实现毕生工作所需的计算和工程资源。从14岁开始,这位现年65岁的发明家就一直致力于创造真正的人工智能,他甚至预测到2029年机器就可以与人类智能匹敌。

作为Google的工程总监,他主要关注于让计算机能真正理解甚至讲自然语言。他希望最终能创造一个在你开始做之前就知道你想要什么的“电子朋友”。

从竞争的角度来看,Kurzweil的关注也是适时的。今年的4月29日,语音搜索应用Google Now正式登录iOS平台向苹果的Siri发起面对面的挑战。Facebook最近又披露已经为其Graph Search增加了一个自然语言接口。很显然,搜索已经开始走出原始的查询“石器时代”。

在接受福布斯杂志撰稿人Robert Hof的专访中,Kurzweil详谈了自己在Google的计划。

Q:你在《How to Create a Mind》中阐述了大脑的工作原理。能否简要解释一下?

A:这个世界是层次化的。唯有哺乳动物拥有新皮质,进化的新皮质可以让我们更好地理解世界的结构,以便我们更好地根据需要改造世界、解决问题。我们的思考是层次化的。人类的第一项发明是语言,语言就是层次化的。

我把深度学习背后的理论称为分层学习,即用一个模型映射待学习的自然现象的层次。如果不做这件事情,搜索就会弱很多,容易为表面上的歧义所愚弄。

Q:你打算如何将这一理论运用到Google上?

A:找出专门针对自然语言理解的层次化方法,分析出语义,开发表示语义内容并对其建模的手段,以便更好地搜索和回答问题。

Google查询中以问题形式提供的比例越来越高。现在的问题尚无法拥有无限复杂性。但是,如果我们可以以层次化的方式对语言建模,通过对数十亿的网页试图表达的东西建模,那么搜索和回答问题就能做得更好。

Q:Google或者谁还没有做完这件事情?

A:有一些科研项目在做此尝试,但是还没有人开发出一整套完整的解决方案。IBM的Watson在理解语义语言方面的工作的确令人印象深刻,证明了此事的可行性。Watson的知识不是靠手工编码获取的。记下来的常识性知识是脆弱的,因为它不足以反映出语言和常识性知识的模糊性。

Watson的做法更加聪明。它通过阅读维基百科等百科全书来获取知识,然后去玩游戏而不是做狭隘的任务。这已经相当于回答问题。

Q:你为什么要到Google来?

A:这个问题我也想了很久。实际上这是我第一次为一家不是我创办的公司工作。我也并不认为自己还有别的地方可去。过去几年我有机会跟Larry Page在若干项目上合作。我们就人工智能这个话题展开了一系列的讨论。这里面的一些技术采用了学习算法,虽然不是很深,但是得益于Google的海量数据而展现出巨大的威力。我们一致认为,Google级的数据以及计算基础设施是创造出更强大的人工智能必不可少的要素。

去年7月,我跟Larry会面讨论我的那本书。当时我说自己有意做一个项目,或者开一家公司来实现书中的想法。他马上提出我应该考虑到Google做这件事,如上所述,因为Google的数据和设施是实现的要素。诚如Larry所言,一家独立公司是很难实施此事的。我一下子就被说服了。

Q:但是有些人对此还是感到惊讶,你做创业家都这么多年了,现在却变成了一名员工。

A:这是一个制造影响的机会。我之所以成为发明家也源于此。为盲人发明的阅读机取得了一些科学突破,但是真正令我满意的是成千上万的盲人说这件东西帮助他们获得了工作和受到教育。有10亿人在用Google。如果我能对此作出贡献,那么在帮助人方面就能产生巨大影响。

这可不是什么小项目。而是我对人工智能50年研究的顶点。我一直考虑致力于终极挑战,在我看来这项终极挑战就是真正理解自然语言并对其建模,然后用于实践。

Q:为什么理解语言是终极挑战?

A:阿兰•图灵的图灵测试完全是基于书面语言的。基本上可被视为即时通信游戏。哪怕在书写形式上令人信服地真正掌握自然语言(图灵测试的关键)也要求全部领域的人类智能。仅仅玩弄一些语言处理的雕虫小技是不够的。是有一些聊天机器人可以欺骗一些人几分钟,但是要想通过图灵测试是不行的。

可见自然语言是一个对人工智能意义重大的领域。在这里做这个项目的确是在任何其他地方所无法比拟的。现在,我已经在这里待了2个月,我可以看出Larry忠告的智慧所在。

Q:为何如此?Google其他什么东西能助你实现目标?

A:比方说知识图谱。要想理解自然语言,就得理解概念和世界上的事物,包括抽象事物和具体事物。姿势图谱现在已经有7亿条目,其间的链接有几十亿,而且现在还在迅速增长。我是没有办法创造这样的东西的。知识图谱绝对是我即将要用的东西。因为如果你要对语言表达的东西建模,就得链接到所有概念的知识库,这里面已经有许多关系存在了。此外还有很多其他的技术,如句法分析,不过在Google之外你是看不到这些技术的。

Q:你的书里面有一章描述了利用软硬件创造想法的步骤。你去Google是不是想干这个?至少最后想干?

A:我透露了大方向。我有专利创意但是显然我不会在书中披露,比方说层次如何建立?书里面没谈。关键是那种层次结构并非与生俱来的。我们生来伴随左右的是不不关联的模块,内在没有任何模式,然后我们甚至在出生之前开始学习了,因为我们的眼睛大概在26周就打开了,然后我们开始倾听声音。

关键的一点是新皮质创建了这种层次,根据自己的经验为这些模块与更高层模块建立连接关系。要想达到一定水平的表现我们需要花上数年甚至数十年的时间。因此,哪怕你在创造新皮质方面干得漂亮,如果没有学习体验也不能成事。因此,创造AI的很多工作都是落在创造学习体验上。

Q:你打算如何做这件事情?

A:对于如何通过模拟新皮质要接触到的数据来建立那种层次我已经有了想法。我现在做的就是这件事。Larry对这本书非常兴奋,并给予了AI高优先权。所以我也有足够的独立性。

尽管Watson击败了两位人类玩家,但是它是靠规模取胜的,因为它可以翻看2亿页的知识。你我都读不完100万页的内容。所以其想法是析取足够多的语义,哪怕我们没有办法像人那样析取那么多,但是可靠量取胜,析取每个一网页、每一页书的语义,然后让搜索更出色。这是搜索和知识导航发展的大方向。

Q:从何开始?做这件事情之前还有哪些类型的挑战需要克服?

A:如何对语义建模我已经有了想法。此为挑战一。说到语音识别,从概念上来讲,将语音信号转换为输出是很容易的:就是对某人所说的转录。然后我可以进行一项艰苦的工作,建立一个百万级的说话方式和正确翻译库。这是个大项目,但是并非不能做。然后还得有一些学习算法。我们用的是层次学习方法。这样你就可以根据经验学习了。

描述语音表达的正确翻译只是第一步,用自然语言理解来描述实际上也是非常困难的。如何才能表达语言的正确意思?哪怕大家说的话有很多歧义这一点忽略不计,你又如何才能描述它呢?我有个想法,就是用图形化的方式来表示语言的语义。虽然这种办法不能完全捕捉到语言的每一个微妙之处,但是现在计算机程序并不会捕捉所有的语义。

然后,我的构思是建立一种语音识别的数据库。很容易就可以获取大量的文本样本,维基百科上面就有数百万的网页。不过然后我就想到要建立一个正确翻译的数据库,用于表示语义的方法中。一旦有了一个新句子,也许是一个用户输入的问题,或者每分钟都会冒出来的一些新网页,它都能对自己的翻译进行校正。

Q:你和你的团队会跟Google其他AI相关的团队一起工作吗?

A:我的团队已经部分组建好了,有些是内部调动过来的,有的则是外面招来的。我可以充分利用这里的其他资源。比方说,我们需要充实知识图谱来合并范围更广的一组关系。用语言来表示各种你想要表达的的关系是不够全面的。所以自然语言理解方面我们要做的一件事情是跟知识图谱团队合作,扩展知识图谱,然后合并更多的关系。

Q:那么最后你的目标是不是要创造一个人工智能,某种能够通过图灵测试及其所涉及的一切的东西,或者是要用这些技术来改善人类大脑?或者甚至这两者兼顾?

A:如果你讨论的是我的职业,我首先是一个发明家,永远都是。我步入未来主义是为了成为一名发明家。时机至关重要,你叫得出名字的发明家都把握住了时机。Larry和Sergey对想到了一个伟大的创意,对互联网链接进行逆向工程,从而开发出更好的搜索引擎。如果这件事情他们做得早一点或者晚一点,也许你们就记不住他们的大名了。这就像双向飞碟一样。回想3、4年前,大多数人都还没有用社交网络、维基或者博客。再倒退10几年前,大多数人都还不会用搜索引擎。

我个人的动机并不是要创造一款能通过图灵测试的计算机。我的个人目标是做近期能做出贡献的工作。自然语言理解并不是在某个的点上完成目标,仅仅是搜索而已。这不是一个我能够完成的项目。

Q:深度学习和神经网络会如何改变计算机的性质?

A:冯诺依曼体系计算机的实际结构跟大脑的组织是相当不一样的。计算机只是一定程度的并行。可是大脑中的100万亿髓棘间骨连接每一个都是并发计算的。所以说这是非常大规模的并行计算。不过这些计算非常慢,相当于每秒钟100次运算。这些计算本身没有一项是关键性的,而是按照概率来组织的。计算机不是这样的。

超级计算机已经要比完全模拟大脑所需的计算量要快了—不过不是在分子水平的模拟,而是功能模拟。这是一个重要的区别。然后Henry Markram还有一个获得10亿欧元资助的蓝色大脑项目。美国还有一个复制版的Brain Activity Map。那个就是分子级的模拟了。

Q:这么说你不认为那是一个可行的办法?

A:呃,这是一个伟大的项目,但那不是创造人工智能的正确方法,只能用来测试我们对大脑工作方式的想法是否准确。这是了解大脑的一个好办法,可以知道神经是如何工作的,离子通道是如何工作的,并对大脑进行大规模的仿真,看看功能是否正确。这的确是研究大脑的一种办法,然后我们可以掌握一些办法,再运用这些仿生算法来创造人工智能。

Q:还有哪些东西决定真正的人工智能何时能实现?

A:有一条加速回报定律。按照信息技术的发展方式,我们总是用今天的技术来创造明天的。软件也是如此。一旦我们有了一个在用的系统,就可以对它进行改进,而这种改进往往是多发性而非线性的。同样的技术可以让我们窥探大脑—大脑扫描的空间分辨率正在呈指数增长。然后我们就可以利用对大脑是如何做事的研究设计出仿生算法来更好地为人工智能服务。