人工智能的瓶颈问题思考

  尼伦伯格等人注意到:“本体论”一词具有歧义性。尽管“本体论”用法五花八门,但可归结为两大类,一是纯哲学的用法,二是具体科学和工程学中的用法。尼伦伯格赞成瓜里罗(N. Guarino)对“本体论”的观点,把前一用法称作“大写的本体论”,把后一用法称作“小写的本体论”。小写的本体论又有形式本体论和工程学本体论两种形式。瓜里罗指出:所谓“形式本体论……是关于先验划分的理论,如在世界的实在(物理对象、事件、区域、物质的量……)之中,在用来模拟世界的元层次范畴(概念、属性、质、状态、作用、部分……)之间作出划分”。[5]工程学的本体论与哲学中的本体论有很大的区别。它既不关心形而上学的“是”的意义,又没有关于实在的本体论分类。它关心的是信息系统中的整合因素,同时还涉及到有关概念分析之结果的本体论判定,因此它是名副其实的工程学本体论。[6]本体论语义学中的“本体论”既不同于形式本体论,又不同于哲学本体论,但从它们那里吸取了有用的东西。尼伦伯格等人说:他们的“本体论建构试图从形式本体论和哲学本体论中得到帮助”[7]在借鉴的基础上,他们对“本体论”提出了新的理解,建立了一种极有个性的本体论。“在本体论语义学中的每种语言的词汇都用相同的本体论来说明意义,因为它一定包含了那个本体论中的所有意义。”[8]尼伦伯格等人认为,“一个人要承认表征和处理意义的可能性,就必须找到这样的具体的意义因素,它们是外部世界实在的替代。而本体论语义学中的本体论就是能直接指示外部世界的最合适的东西。它实际上是世界的模型,是据此而建构的”[9]总之,本体语义学所说的本体论不过是语言加工系统中的一种概念框架,其作用是对输入的语词做本体论定位,为其有语义性创造条件。

二 本体论语义学关于语义加工系统的构想

  要回答机器的语义加工何以可能,完成机器对人类自然语言加工的模拟,首先必须解决的问题是:人的自然语言加工何以可能?根据本体论语义学家的研究,所以可能的条件不外是:人类有将它与语言关联起来的能力,有别的技能,有情感和意志之类的非理性方面,因为人们赋予语词的意义常带有情感色彩。另外,就是活动的目的、计划及程序,最后就是各种知识资源。

  本体论语义学认为,人类之所以能理解和产生意义,最重要的条件就是人类有一种本体论图式。正是借助它,任何语言一进到心灵之中就有了自己的归属,被安放进所属的类别之中,如听到了“红”一词,人们马上有这样的归类:它指的是属性,与“绿”“蓝”等属一类,为物体所具有,因而不是物体,等等而是基本概念与范畴。尼伦伯格等人说:“本体论语义学试图探讨的是人们在内省式和反思式地看待概念时对这些概念的运用。人们常常谈论属性。虚构的实在(独角兽或赫尔墨斯)和抽象的实质,把它们当作存在的。不过对于我们来说,决定把它们放在本体论之中不是根源于这样的事实,即这些实在是用自然的语言指称的,而是因为我们相信:由于人们在他们的宇宙中有这些概念因而语言才指称它们。”[10]因此,在语义机模型中,我们首先要建立的就是这种本体论图式。根据他们的看法,“本体论提供的是描述一种语言的词汇单元的意义所需的原语言,以及说明编码在自然语言表征中的意义所需的原语言。而要提供这些东西,本体论必须包含有对概念的定义,这些概念可理解为世界上的事物和事件类别的反映。从结构上说,本体论是一系列的构架,或一系列被命令的属性-价值对子。”[11]它为要表征的词项的意义作本体论的定位,即说明它属于哪一类存在,其特点、性质、边界条件是什么。例如当有一词“pay”输入进来,首先就要经过本体论这一环节,换言之,该词首先要被表征为一个本体论概念,要被放进本体论的概念体系之中,一当这样做了,它的属性、值便被规定了。有了本体论概念框架,在这种静态知识资源上就可以不断生成各种含有意义表征的动态知识资源。动态的知识资源是在应用所提出的任务、要求的基础上所产生的知识。

  有了关于人类加工自然语言所需条件比较清楚和量化的认识,就有可能通过建立相应的网络让计算机也获得这样的条件,进而让机器表现出对意义的敏感,最终具有语义加工能力。本体论语义学相信:这不是没有可能的,至少有巨大的开发前景。对此,本体语义学进行大胆地尝试,并建构出典型的语义加工模型。其具体操作就是:先让加工器具备静态和动态的知识知源,然后让其有相应的加工能力。在实践的基础上,尼伦伯格等人通过分析公认的自然语言加工Stratified模型,详细说明了机器进行语义加工的基本原理与过程。