AI智商达到多少了?未来智能实验室启动AI智商评测

这其中冯?诺伊曼结构给予我们的启发是:标准智能系统模型应包含输入输出系统,能够从外界获取信息,能够将内部产生的结果反馈给外部世界,只有这样,标准智能系统才能成为“活”的系统。

戴维.韦克斯勒关于人类智能的定义给予我们最大的启示是:智力能力是由多个要素组成,而非图灵测试或视觉图灵测试那样只关注智力能力的一个方面。

DIKW模型体系给予我们的启发是:智慧是一种解决问题,积累知识的能力;知识是人类不断与外界交互后沉淀下来结构化的数据和信息,这提醒我们,一个智能系统不仅仅体现出知识的掌握,更重要的还有关于解决问题的创新能力。

这种关于知识的掌握能力,知识的创新能力与戴维.韦克斯勒理论、冯.诺依曼架构结合,就可以形成智能系统智力能力的多层次结构。

这种关于知识的掌握能力,知识的创新能力与戴维.韦克斯勒理论、冯.诺依曼架构结合,就可以形成智能系统智力能力的多层次结构。综上所述,我们得出智能系统的标准模型应该具备一下特点:

第一、具有输入输出的功能,即可以与外界通过数据、信息和知识进行交互的能力。

第二.具有存储数据、信息、知识的能力,即将外界数据、信息和知识化为自身资源的能力。

第三.具有生成新数据、信息和知识的能力,即基于自身拥有的知识,在新数据或信息的启发下,对数据、信息和知识进行创新从而产生新的数据、信息和知识的能力,如图1.4所示(为了简化,本图中数据、信息、知识统一用知识描述)。

为了更好的分析AI,人类等智能体的智能水平,研究团队把“知识的获取,掌握,创新和反馈”又分成15个小分类,从更多维度评测AI,人类的智能。这15个小分类是:图像、文字、声音的识别和输出,常识、计算、翻译、排列,创作、挑癣猜测、发现等。研究人员根据这些分类的维度,在2014年,对世界50个AI系统和3个不同年龄段人类进了测试。

2016年2月,研究团队开展了“2016年人工智能系统的智商测试”,对包括谷歌、百度、搜狗、苹果Siri、微软小冰在内的人工智能系统进行了测试,从测试结果看,谷歌、百度等人工智能系统的性能比两年前已有大幅提高,但仍与6岁儿童有一定差距。

相关研究方法和测试结论发表在IJIT & DM、Annals of Data Science、中国计算机学报等SCI、EI,中国核心期刊上,这一研究成果受到了美国著名财经媒体CNBC,麻省理工科技评论,ZDNET,YAhoo等美国,德国、日本、意大利、英国、法国、俄罗斯、新加坡、台湾地区和中国大陆媒体的报道。

从近4年的持续研究看,虽然人工智能系统这两年得分增长很快。在知识的掌握方面得分比较高,在知识的获取和反馈方面有很大提高,但还有很多不足。在创造性这个大分类上,得分一直进展不大。而且由于这个分类的权重又比较高,因此目前为止依然无法超越6岁的儿童。

四、未来智能实验室:开展第三次世界人工智能智商测试

2017年11月,研究团队成立未来智能实验室,基于实验室“标准智能系统”、“AI智商测试量表”、“智能系统7个等级划分”、“互联网(城市)云脑架构”等研究成果,建设世界第一个智能系统智商评测与趋势研究机构,致力于评测智能系统智商发展水平,研究智能系统未来发展趋势。目标是成为世界领先的智能系统评测和发展趋势研究机构。

未来智能实验室根据人工智能的最新发展,在人工智能学家,中国科学院虚拟经济与数据科学研究中心的支持下启动2018年世界AI智商评测活动(WorldAI IQ Test 2018),对世界范围人工智能系统智能发展水平进行新的评测。以观察世界范围内人工智能最新发展水平以及与人类的差距。本次活动,实验室将开展多种形成的研究和评测工作,除了测试2018年人工智能的发展水平,还将第一次对互联网群体智慧的智商进行测试。