如何测量智能产品的AI智商水平,论AI的三种智商

2.智能系统三种不同智商的定义

2.1 AI通用智商的提出

基于标准智能模型,研究团队建立AI智商测试量表,分别与2014年和2016年对包括谷歌、Siri、百度、Bing等50多个人工智能系统和6岁,12岁和18岁人群进行AI智商测试。从测试结果看,谷歌、百度等人工智能系统的性能比两年前已有大幅提高,但仍与6岁儿童有一定差距.

应该说上述AI智商测试是为了解决AI能否超越人类智能这个问题而开展的,这个研究是将每一个智能系统包括机器人,AI软件系统,人类,动物和其他生物当做平等的智能体,观察其与自然界,其他智能体在交互中显示出来的智能水平。

AI通用智商的定义如下:基于标准智能模型,为了解决“评价各智能系统发展水平高低”的问题,将各智能系统视为平等的智能体,通过统一的AI智商测试量表形成的智能评测分数,可以称为AI系统的通用智商Artificial intelligence ?General intelligence quotient (AI ?G IQ)。

2.2. AI服务智商的提出

在实践中,我们发现除了少数AI系统的产生是出于科学实验目的,不为人类提供辅助性服务,其他大多数AI系统是为了更好的服务于人类而被制造出来,它的智能也主要体现在为人类服务的过程中,智能水平越高,也就能更好的为人类提供服务。

这种情况下,如果用AI的通用智商标准进行评测,就明显与产品的最初被制造出来的目的有重大差异。这就需要我们根据此类AI系统的特点,基于标准智能模型,选择与服务相关的指标进行评测,

这些指标与AI的通用智商评测指标有相关性,但又有比较大的差异。包括对人工智能的法律,伦理道德等约束条件也应该放在智能系统服务智商中。而不用放在智能系统的通用智商中。

AI服务智商的定义:基于标准智能模型,为了回答“智能系统如何才是更好的服务于人类”的问题,对智能产品在服务过程中体现的智能水平进行测试,并形成的智能评测分数,可以称为AI系统的服务智商,Artificial intelligence ?seveice intelligence quotient (AI S IQ)。

2.3.AI价值智商提出

为人类提供服务或支撑性工作的AI系统,往往会由不同的公司和企业提供相应的智能产品,例如智能音箱就有亚马逊、百度等品牌,智能聊天机器人包括科大讯飞、苹果Siri等,由于是由不同企业生产制造,完成相同或相近功能,每个企业的造价或售价也会不同,服务智商与成本或价格关联会对消费者购买智能产品产生重要的影响。

AI价值智商的定义:基于标准智能模型,为了帮助使用者判断需要用多大经济代价获得智能系统的智力能力, 将智能系统的服务智商除以该系统的出售价格,形成的智能评测分数,可以称为AI系统的价值智商,Artificial intelligence ?Value intelligence quotient (AI V IQ)。

3.智能系统通用智商和服务智商的测试量表设计。

3.1.智能系统通用智商的测试量表

为了解决AI能否超越人类智慧的问题,2014年开始,本文研究者根据标准智能模型把智能分为“知识的获取,掌握,创新和反馈”四类能力,在这四类之下又分成15个小分类能力,从更多维度评测AI,人类的智能。这15个小分类是:图像、文字、声音的识别和输出,常识、计算、翻译、排列,创作、挑癣猜测、发现等能力,每个小分类有不同的权重。

2017年,根据人工智能的发展和对智能的最新研究。研究团队将AI通用智商评测量表从测试分类和分类权重进行调整,主要调整的内容增加了:1.识别动态图像的能力,2.情绪的识别与表达能力,3.识别敌我的能力,4.伪装真实意图的能力,5.实现移动定位的能力,6.实现改造世界的能力。除此之外对常识和创作的测试也做了更为细化的工作。