人工智能研究的若干进展

计算智能(Computing Intelligence)涉及神经计算、模糊计算、进化计算等研究领域。其中,神经计算和模糊计算已有较长的研究历史,而进化计算则是较新的研究领域。在此仅对进化计算加以说明。

进化计算(Evolutionary Computation)是指一类以达尔文进化论为依据来设计、控制和优化人工系统的技术和方法的总称,它包括遗传算法(Genetic Algorithms)、进化策略(Evolutionary Strategies)和进化规划(Evolutionary Programming)。它们遵循相同的指导思想,但彼此存在一定差别。同时,进化计算的研究关注学科的交叉和广泛的应用背景,因而引入了许多新的方法和特征,彼此间难于分类,这些都统称为进化计算方法。目前,进化计算被广泛运用于许多复杂系统的自适应控制和复杂优化问题等研究领域,如并行计算、机器学习、电路设计、神经网络、基于艾真体的仿真、元胞自动机等。

达尔文进化论是一种鲁棒的搜索和优化机制,对计算机科学,特别是对人工智能的发展产生了很大的影响。大多数生物体通过自然选择和有性生殖进行进化。自然选择决定了群体中哪些个体能够生存和繁殖,有性生殖保证了后代基因中的混合和重组。自然选择的原则是适者生存,即物竞天择,优胜劣汰。

直到几年前,遗传算法、进化规划、进化策略三个领域的研究才开始交流,并发现它们的共同理论基础是生物进化论。因此,把这三种方法统称为进化计算,而把相应的算法称为进化算法。

4.3 数据挖掘与知识发现

知识获取是知识信息处理的关键问题之一。20世纪80年代人们在知识发现方面取得了一定的进展。利用样本,通过归纳学习,或者与神经计算结合起来进行知识获取已有一些试验系统。数据挖掘和知识发现是90年代初期新崛起的一个活跃的研究领域。在数据库基础上实现的知识发现系统,通过综合运用统计学、粗糙集、模糊数学、机器学习和专家系统等多种学习手段和方法,从大量的数据中提炼出抽象的知识,从而揭示出蕴涵在这些数据背后的客观世界的内在联系和本质规律,实现知识的自动获取。这是一个富有挑战性、并具有广阔应用前景的研究课题。

从数据库获取知识,即从数据中挖掘并发现知识,首先要解决被发现知识的表达问题。最好的表达方式是自然语言,因为它是人类的思维和交流语言。知识表示的最根本问题就是如何形成用自然语言表达的概念。

机器知识发现始于1974年,并在此后十年中获得一些进展。这些进展往往与专家系统的知识获取研究有关。到20世纪80年代末,数据挖掘取得突破。越来越多的研究者加入到知识发现和数据挖掘的研究行列。现在,知识发现和数据挖掘已成为人工智能研究的又一热点。

比较成功的知识发现系统有用于超级市场商品数据分析、解释和报告的CoverStory系统,用于概念性数据分析和查寻感兴趣关系的集成化系统EXPLORA,交互式大型数据库分析工具KDW,用于自动分析大规模天空观测数据的SKICAT系统,以及通用的数据库知识发现系统KDD等。

4.4 人工生命

人工生命(Artificial Life,ALife)的概念是由美国圣菲研究所非线性研究组的兰顿(Langton)于1987年提出的,旨在用计算机和精密机械等人工媒介生成或构造出能够表现自然生命系统行为特征的仿真系统或模型系统。自然生命系统行为具有自组织、自复制、自修复等特征以及形成这些特征的混沌动力学、进化和环境适应。

人工生命所研究的人造系统能够演示具有自然生命系统特征的行为,在“生命之所能”(life as it could be)的广阔范围内深入研究“生命之所知”(life as we know it)的实质。只有从“生命之所能”的广泛内容来考察生命,才能真正理解生物的本质。人工生命与生命的形式化基础有关。生物学从问题的顶层开始,把器官、组织、细胞、细胞膜,直到分子,以探索生命的奥秘和机理。人工生命则从问题的底层开始,把器官作为简单机构的宏观群体来考察,自底向上进行综合,把简单的由规则支配的对象构成更大的集合,并在交互作用中研究非线性系统的类似生命的全局动力学特性。

人工生命的理论和方法有别于传统人工智能和神经网络的理论和方法。人工生命把生命现象所体现的自适应机理通过计算机进行仿真,对相关非线性对象进行更真实的动态描述和动态特征研究。

人工生命学科的研究内容包括生命现象的仿生系统、人工建模与仿真、进化动力学、人工生命的计算理论、进化与学习综合系统以及人工生命的应用等。比较典型的人工生命研究有计算机病毒、计算机进程、进化机器人、自催化网络、细胞自动机、人工核苷酸和人工脑等。