不过,神经网络为新的AI领域构筑了一部分基础。一些继续在ANNs上奋斗的研究者终于意识到这些网络可以被认为是在统计和概率方面对外部世界的重现。与“突触”和“动作电位”这些生理学上的称呼不同,他们称之为“参数化”和“随机变量”。田纳邦说,“现在,ANNs听起来更像一个庞大的概率模型而不是一颗大脑。”
然后在1988年,加州大学洛杉矶校区的朱迪亚·珀儿写了一本里程碑式的书《智能系统的或然性推理》,里面详细地描述了AI的全新方案。支持这本书的理论是汤玛斯·贝叶斯提出的一个原理。汤玛斯·贝叶斯 是18世纪的一名英国数学家和牧师,他把以事件Q发生为前提下事件P发生的条件概率和以事件P发生为前提下事件Q发生的条件概率联系起来。这个原理提供了一个在原因和结果间来回推导的方法。“如果你能对感兴趣的不同事物用那样的方式描述,那么贝叶斯推论的数学方法会教你如何通过观察结果,然后逆推各种不同起因的可能性,”田纳邦如是说。
新方案的关键就是贝叶斯网络,一个由各种随机变量组成的模型,在这个模型里每个变量的概率分布都取决于其他变量。给定一个或多个变量的值,通过贝叶斯网络则可推导出其他变量的概率分布,换言之,得出他们的可能值 。假定这些变量表示症状、疾病和检查结果,给出检查结果(一种滤过性病毒感染)和症状(发热和咳嗽),则可给可能潜在的病因赋予不同的几率(流感,很可能;肺炎,不太可能)。
二十世纪九十年代中期,包括罗素在内的研究员开始开发算法,使贝叶斯网络能利用和学习现有的数据。这很大程度上跟人类基于早期理解的学习方式相同,新的算法却能通过更少的数据来学习更复杂和更准确的模型。对ANNs来说,这是前进的一大步,因为无需考虑先验知识,可以从头学习解决新的问题。
搜猎核武器
人们开始逐渐理解各种努力和尝试,去创造为现实世界而设的人工智能。一个贝叶斯网络中,各种参数是概率的分布,如果我们对这个世界知道得越多,这些分布值越有用。与一阶逻辑下构建的网络不同,不完整的知识并不会导致贝叶斯网络迅速崩溃。
尽管这样,逻辑也并非无用武之地。事实证明贝叶斯网络本身并不充分,因为它不允许以简单片段任意构建复杂结构,取而代之的是一个由综合的逻辑程序和贝叶斯网络组成的,进入热门话题领域的概率性程序。
这种新AI的最前端是少数合并基础元素和所有静止研究工具的计算机语言,其中有Church语言,由古德曼、田纳邦和同事开发,以某计算机程序逻辑的开创者阿隆索·丘奇命名。多明戈斯的团队开发了马尔科夫逻辑网络,融合了逻辑型网络和与贝叶斯网络相似的马尔科夫网络。罗素则和他的同事使用了一个直接明了的名字,叫“贝叶斯逻辑”(BLOG).
最近在奥地利维也纳召开的联合国全面禁止核试条约组织(CTBTO)大会上,罗素展示了Church语言的表达能力。CTBTO邀请了罗素,因为他们预感到新的AI技术可能有助于监测核爆炸。听过一上午的关于监测地震背景下远距离核爆引发的地震特征、穿过地球的信号传播异常和世界地震站的噪音探测器的演示报告后,罗素开始着手用概率程序的设计(神经信息处理系统前沿,卷23,麻省理工学院出版Advances in Neural Information Processing Systems, vol 23, MIT Press)。他说,“在午饭时间,我已能为整个问题编写一个完整的模型。”,这个模型足足有半页之长。
这类模型能整合先验知识,例如,对印度尼西亚苏门塔腊和英国伯明翰地区发生地震的几率做比较。CTBTO同时要求任何一个系统首先假定发生在地球上任何地方的核爆几率均等,然后才使用来自CTBTO监测站接收的真实信号数据。AI系统要做的就是获取所有数据,对每组数据最可能的解释作出推断。
挑战就在其中。像BLOG这样的语言是由所谓的通用推理机组成的。已知某个现实问题的模型和众多变量及概率分布,推理机只能计算某种情况的可能性,例如,在已知期望事件的事前几率和新地震数据下,推断一次在中东发生的核爆。但是如果变量改成代表症状和疾病,那么它就必定能做出医学诊断。换言之,其中的算法必须是非常普遍的,这也意味着这些算法极其低效。