怀进鹏:人工智能仍有计算瓶颈 智能汽车值得关注

undefined

8月28日,由中国中文信息学会和中国计算机学会联合主办的首届语言与智能技术高峰论坛(Language & Intelligence Summit)在北京召开,主题为“语言与智能的未来”。

清华大学计算机系教授、中国科学院院士张钹,中国科学院院士、计算机软件专家怀进鹏,微软亚太研发集团主席、微软亚洲研究院院长洪小文,香港科技大学教授、美国人工智能协会(AAAI)Fellow杨强,美国卡耐基梅隆大学邢波,百度副总裁王海峰,科大讯飞轮值总裁胡郁等人工智能领域专家及学者到场参会并发表主题报告。

会上,怀进鹏表示,人工智能在技术发展当中仍然出现计算的基本瓶颈问题,虽然计算能力很大,有千万亿,又要延续百亿的计算机。但现在处理结构带来了很多新的思考,包括学习效率等,这些都是所看到的新问题。

同时,他表示,面向2020年,信息经济将会成为中国非常非常重要,信息消费规模将达到6万亿,而他对GDP的比重从现在的27%将达到40%以上,所以未来得人工智能、虚拟现实对整个信息经济的影响是相当重要的。

另外,他认为人工智能需要大家准确把握发展的窗口期,准确的把握和发展的阶段是非常重要的,特别是如何来寻找和产业、应用的痛点,找出把握好市场和政府推动的关系。在这段关系当中将会围绕中国制造2025,特别是制造业的发展,来打造智能制造、智能工厂,或者中国的方式是两化融合来推动,我们会重点做五大类的工作:一是在技术方面,二是产业基础,三是公共平台,四是培育重大的应用,最后搭建一个公共的服务平台。

谈到人工智能的应用,他表示:智能汽车是一个值得关注的企业,既有未来2020年5G的发展,也有高端服务业、汽车,这三个行业之间的叠加创造了新的维度,也是一个难得的机会。

以下为怀进鹏全部演讲内容:

怀进鹏:尊敬的李生理事长、高文理事长,尊敬的洪小文院长,王坚总裁,还有各位朋友。今天非常高兴受邀来参加这个会,见到了很多的专家。

就像刚才两位理事长所提的人工智能现在风生水起。前一段时间开会的时候,信息领域的投资者好象不谈人工智能和虚拟现实就觉得已经OUT了,这反映了一个情况,这个产业在快速生长和发展,大家在谈的几个热词,云计算、大数据非常火,现在是AI、VR、区块链,现在只要搞技术的人,搞产业的人都在关注这方面,这本身对产业的发展和技术有很多的期待,特别是语言智能引起了很多人的联想,使物有人一样的智能,是人一直的追求,就像登月一样。今天在这里我想跟各位简单交流一下对这方面技术理解和思考,期待我们共同努力,能够对技术产业未来得发展出一点力。

李老师讲过今年AIphaGo所引起的广泛影响,人们预测再过30年,大概人类的文明将进入一个新的时代,有关这方面的表述也特别多,但是更多我们可以看到在社会当中,从AIphaGo之后,无人机、无人驾驶,人工智能新材料,特别是语言的理解、语音的理解方面,一下子全都集中起来,实际这些年在这些方面取得了非常重要的进步。如果人工智能最近这些年在应用当中发生了很大变化,我们思考其中有三个因素在推动技术的形成和进一步的应用发展。一是数据本身是智能产生的一个原材料,大数据的发展和数据资源的快速积累,给人工智能创造了很多发展的前提。二是深度学习在这十年左右,实际上给信息技术的处理和信息应用带来更多的机会。三是关键技术和基础设施,比如说手机,三年前的手机已经相当于40年前的一个计算机,现在手机以苹果5S为基础,已经相当于当时的计算机。如果按照计算能力的提升,71年有了第一款数据处理器,人们也在按照摩尔定律简单地做计算。2018年的时候,大概我们的计算机晶体管的集成度将要超过以前,创造了数据处理的新变化。

第一个层面的思考,有了大量的数据和数据处理能力的时候,是不是就能够产生智能?从语法到语义,人除了数据还有情感,数据到情感这条路线、这个桥梁是怎么过渡过来的,所以语法和语义的区别是基于数据和情感的,和人们的认知和决策是有区别的。

微软前一段时间做人工智能的报告也在讲,我们也都在问,他知道他在说什么吗?他能知道他在说什么吗?过来知道他曾经有过什么?有关这样的一些问题,也就是从认知方面,是不是我们还有很多新的机遇?如果我们去简单理解的话,一些无关的数据是否能被认为有关的知识或者信息,我们也希望按照数据处理的方式,从无序到信息、到知识,再到所谓我们的智慧,能够真正构造出这样一种方式,从数据而来,从计算产生我们的技术。也许人工智能第一个重要的路径就是走向上数据计算的发展模式,数据计算、商业计算,以及我们现在说的云计算。

过去5年大家都很清楚,数据的突破带来很多智能性的发展,包括计算技术、感知处理的技术和数据处置技术,也有很多重大辅助系统和问答系统的出现。同时数据处理有关人类智能方面的很多工作,特别是用机器的方式来发展。

从数据的智能到人类的智能过程当中究竟还有多远?我们举一个简单的例子,数据的处理是不是能给我们创造智能?但数据处理和我们传统的理解,经验计算模式就会产生差别。第一个差距,工业革命以来所有的计算是采样计算,都是精确的、均匀的。在发展过程中到信息数据进行关联的时候,由于大规模数据的出现,也不可能处理到每一个节点上,如果做饭的时候,炒青菜不熟的时候我们会尝一尝,在大数据时代,尝一尝的方式已经失效了,已经很难反映出这样的规律。在这个过程当中,我们现在依赖的仍然是基于统计学的基本假设。

第二是精确与非精确,精确性不再是绝对追求目标,需对宏观趋势给出快速预测,如果买一双鞋不会跑遍北京所有商店,当然现在上网就可以买,不用到所有的都比较完之后再买,现在可以做定点销售,做画像,以更好的去传播。

第三是所有推进的逻辑基础都是基于因果与关联,关联之间的联系是不是改变了我们的方式或者从科学价值的角度来说,我们一致认为科学有因果关系,我们是按照想象建立数据之间的关系,最后图谱以后最后形成最后的因果关系,我们才能得到逻辑,因此从数据作为分析的基础,能产生智能来看,我们还有一些需要思考和待继续研究的问题。以我们已经假定的事情来解释,从解释当中进一步开展工作。所以除了过去的人工要求以外,可以通过多层、深度来解决自动化,这个自动化,人类对问题的理解的差异性,就像我们常讲的三岁小孩儿来看图识子的时候不是一样,所以这里就会有很多新的方式。

在这里分享一下我们实验室对这个问题主要从数据和智能方的思考,第一,如果人工智能走向产业或者成为一个独立的门类,那它的科学性在什么地方?无论计算能力多么好,无论数据多大,总有一个基本的问题,就是数据科学的科学是什么?所以计算机科学当中算法是重要的,复杂性是来提供重要的基础。有关这方面的内容,不展开讲,过去每一个时点在计算复杂性都有重大的突破,但是二十世纪大数据时代,我们经常说从IT到DT,从IT到新IT,传统的信息技术到智能技术,在这个过程当中就会有一些新的变化。二是有没有数据基础。如果数据关联就能成为科学,计算的复杂性也是重要的。第二,我们是否能够有它的工业系统能给出的技术,因为我们毕竟对它的逻辑和因果关系不太了解,所以我们知道哥德尔定律,对的就是一定能证明的,能证明的东西必须是对的。在这样一个开放系统下,通过这样数据的关联是否能建立因果关系?

数据库的成长,从早期外设问世,催生数据管理需求,将数据库从文件系统中分离出来。面对新的问题,数据库的发展本身也面对很多挑战。这是第一个问题,数据是否能成为科学,表现在计算的领域和对话系统是不是有机会。二是计算模型是否存在重要的突破,问题表现在是不是走到了一个转折点,这个转折点表表现在器件和系统。因为最近关于非意识存储所呈现的计算联动的新的架构的重新思考,这为技术的工程化实际上业提供了一种思考。

左边这张图表达的是从过去摩尔定律之后特别是沿着传统的路线发展过程当中,我们看到从硬盘再到Flash过程当中的新的机构,以便创造出新的应用的方式。自然的一个想法是计算和存储的融合是不是一个重要的支撑点。

分布式系统层面中,有很多新的机会,包括内存计算为基础的,所谓数据流的计算、图计算的系统,这样一个计算系统为我们处理计算的方式是不是完整的,这样模式的延伸就是现在处理最重要的。

三是我们经常在一起讨论的智能一致性的问题,群体智能的可行性问题。通过整合其他学科的知识对亿我们认知的能力进行不断的完善,在这个领域像李生理事长所讲的是智能的最高阶段,也是我们期待的过去想超越的,在原来图灵测试基本方式又走向了新的应用。这个领域的发展空间现在非常多的,而且也出现了很多积极的效果,这方面的效果也推动了社会在学术界、产学界的新期待。

总体来说,我觉得人工智能在技术发展当中仍然出现计算的基本瓶颈问题,就是虽然计算能力很大,有千万亿,又要延续百亿的计算机。现在处理结构也给我们带来了很多新的思考,最后是学习效率,这些是所看到的新问题。人们期待的通过一种通用的模型,再加上对人脑计算的发展来进行思考,所以如果顺着第二第三条方式交叉的话,设务脑可能也是一个数据处理系统,由此引入第二条研究的途径,对脑科学的认识和模拟是否能够对智能产生重要的影响,这些领域我也把前面第三个问题和它相关的联系在一起,表现的对话系统和一些记忆芯片,这个领域也有很多工作开展。

对应前面计算产生智能,数据作为源头来开始,在认知和模拟脑方面一直在开展这项工作,特别是最近几年,美国和欧盟分别启动了重要的脑科学的计划,也在不断的探索这个领域的发展模式,所以说到这里,计算产生智能,人脑和脑科学的研究也在于智能,以前开玩笑,张老师跟别人调侃,我们作为人来说,对脑的认识是有局限的,有局限的人的脑力去研究人的脑,是不是我们进入了一种新的悖论,所以应该从数据和计算产生智能,来看待这个特征,因为我们理解上的局限性会影响我们研究问题的有效性。但是这两种方式,如果最后是一种计算系统,我们就可以把计算机在外部模拟计算和重要的方法和计算模式有效的和脑科学结合,也许会产生不一样的事情。怎么去融合这两条路径?我觉得从事信息领域的人和从事神经科学的人也正在探讨这个方向。

北航在北京市的支持下成立了一个大数据科学和脑机智能的工作,期望通过在计算方面、系统技术设计与仿真方面、认知机理方面来开展一些有选择性的工作,所以今天看到这么多年轻的新的面孔,也欢迎各位多交、沟通,推进这项工作,我们也希望能够透过数据智能或数据的分析,来为数据的科学基础和技术的准备做些贡献。

简要在这里跟各位报告一下对产业的发展。对人工智能,上个月底和杨强教授讨论,他说应该分析一下我们产业中的痛点,现在产业中的大概具备的基本条件,以便我们说应用过程当中,讲产业的时候是不是有改变我们现代现实的一部分的需求。MIT也专门讲,人工智能走向三个阶段,从逻辑推理、专家系统到现在的深度学习发展,也认为这是人工智能的第三次浪潮。扎赫特(音)在上个月做了一个新兴技术的预测,其中把人工智能作为重要的内容,我们看到相当多的发展空间,最好的预测未来25年将会对产业的形成和发展起到很重要的作用。

这个内容大家都知道,在世界经济论坛预测未来10-15年产业出现新的拐点当中提出了六大趋势,其中第四点就把大数据和人工智能作为重要的产业发展方向,需要引起重视。它不是专门的咨询机构,而是众多的州和全球在多个领域和产业界的关注的焦点,并把它凝练出来,做了相当长时间的研究和分析。它对大数据和人工智能未来对产业化的影响更多的是理解对决策的思考方式,而从这里我们看到,人机物的互联,计算、通信和存储新的影响,以及物联网,IOT,还有分享型经济和数字化。说白了,这些都对我们现在看的人工智能有新的突破和新的支撑。

据BBC的报告,大概到2020年,全球人工智能的市场规模达到183亿,总规模并不是很大,但是增长率是非常高的。投资领域的规模,从2013年2015年他们做了一个基本的对比,整个的投资金额、笔数也处于快速发展的过程当中。亚洲发展的速度也挺快,中国现在号称人工智能公司非常多的,就像每一个内容兴起一样。

真正的人工智能是否进入到产业爆发的拐点,有几个基本的标志,有没有规模化的痛点或者能改变产业的内容。这里人们讲深度学习是否是为人工智能提供了大规模的商业化水平,云计算和大数据是不是人工智能成长的数据基础,而资本的持续投入是不是对它的成长更有好处,但是人们更加关注规模应用和它发展的痛点。所以我想在这里有一个基本的情况跟各位报告一下,人工智能和制造业的发展。

因为机器人和无人机或者未来发展的自动驾驶,确实有可能对这个行业产生变革,就跟第一次蒸汽机、纺织机出现以后,大量的农民和工人失业了。改变行业的状态,麦肯锡预测,10年之后制造业和服务业领域的机器人可能会取代4千万到7千万全职工人。Gartner预测,2025年1/3被机器人或智能软件代替无人驾驶,使300万卡车司机失业;牛津大学,47%的就业面临“危险”。所以人们在讲,凡是人类在进行重复性或者可进行流程化管理工作,机器代替人是一种比较流行的方式。这种方式也可能是人工智能产业发展最最主要要推动的在这些领域当中,投资的幅度相对高,也会相对快。

另外在医疗培训和教育行业,这里也有相当的方式,包括我们以前看到的MOOC的模式,包括对医生医疗。

数据计算和模式将会改变我们对问题的理解,除了我们过去在网络计算下考虑的互联网,我们添加了设备计算的、智能计算,而且带来了很多新空间。而正在开始的物理世界的互联所形成的IOT或者叫做工业互联网、产业互联网。去年9月份,美国曾经在讨论,叫“重启IT革命”,他们认为在过去的技术发展中IT已经太沉寂了,缺乏新的亮点,而发展过程当中,数据的快速增长和传感器的大量部署,特别是移动设备智能终端的兴起,对整个产业出现了新的拐点,这个拐点将会是“重启IT革命”。从这样发展中我们看到它列入了八个领域,在这八个领域中包括感知计算,特别谈到智能存储,也谈到下一类的制造范式,而且提出所谓Insight Computing(洞察计算)。现在很搞人工智能的公司和咨询公司也在谈Insight。这样一个领域发展也有另外一个领域在支撑它,影响制造业的颠覆性技术以及未来制造业的革命性技术都把数据处理的方式、云计算作为未来很重要的一点。

经济应用,世界经济论坛也提出未来分享经济是重要的一种。分享经济,2010年《时代周刊》作为改变世界的10大想法之一。最近出现了一个按需经济,在这样一个巨大的新兴技术和市场发展过程中,对过去工业时代的规律和经济模式会有一个必然的变化。所以需要我们去思考生产力之外的一些模式的问题。与此更重要的,我们也需要在人工智能、虚拟现实技术上不断发展,不断应用,不断推动产业化,这样一些不确定性还没有完全把握的过程当中,如何有效的去理解并且推动和培育新应用模式就会非常重要。在我们预测趋势的时候,也对产业发展的转折点,转折的方式给予思考,也许我们会更加有效的对它做出判断。

在这个领域中国又有很多的机会,习总书记在4月19号还专门讲到关于大力发展信息、拓展信息经济空间,其中重要的就是把信息化和工业化,互联网和实体经济结合作为一个重要的领域。在这里,中国对人工智能产业有极大的发展空间,也有巨大的市场。因为我们的产业规模是互联网基础设施和信息基础设施规模世界最大,信息经济已经成为整个国家经济发展的新动能,我们看到它占GDP的比值从2014年超过了25%,去年达到了27%。而信息产业也成了我们支柱型行业,有很多这方面的工作。

面向2020年,信息经济将会成为中国非常非常重要,信息消费规模将达到6万亿,而他对GDP的比重从现在的27%将达到40%以上,所以未来得人工智能、虚拟现实对整个信息经济的影响是相当重要的。所以产业虽然在发展阶段,但是人工智能对经济社会的贡献和可能产生的重大影响也包括社会现代化和治理,都将会有重要和积极的作用。这是跟各位分享的一些产业现代的理解特别是和制造业和未来发展中,机器人、无人机、智能驾驶所创造了空间,这是一大部分,另外一达到是关于教育和培训。

最后对人工智能简单讲几句话,人工智能需要我们准确把握发展的窗口期,准确的把握和发展的阶段也是非常重要的,特别是如何来寻找和产业、应用的痛点,找出把握好市场和政府推动的关系。我们在这段关系当中将会围绕中国制造2025,特别是制造业的发展,来打造智能制造、智能工厂,或者中国的方式是两化融合来推动,我们会重点做五大类的工作:一是在技术方面,二是产业基础,三是公共平台,四是培育重大的应用,最后搭建一个公共的服务平台。

整个的层次结构分为四层,从基础研究到技术基数以及重要行业应用,这个部分已经开始在产业部门已经在布局,关于在产业的应用,主要是在智能制造机器人、智能汽车、无人系统包括智能驾驶主要的内容,同时打造一些公共的服务平台,但是在研究方面,在技术、产业,特别是智能制造与机器方面的工作也是特别重要的,所以我们讨论语言和智能的关系,语言和智能应用的结果,也将会对机器人,特别是在服务机器人当中创造很多的空间。智能汽车是一个值得关注的企业,既有未来2020年5G的发展,也有高端服务业、汽车,这三个行业之间的叠加创造了新的维度,也是一个难得的机会。

我们现在围绕中国制造2025去年5月份发的国务院的文件,作为制造业转型升级,也在今年5月13号同样发布了一个两化融合,推动互联网与制造业融合发展,在这份意见当中,我们把制造业和互联网的融合,搭建双创平台,支撑中小企业发展和社会技术应用的平台,同时为了在制造业发展当中更有效的走向智能制造,但是先要完成数字化的改造。在这一领域当中,有一个新点就是感知计算、工业软件、工业互联网和工业云平台支撑好智能制造的发展。

最后,信息技术的跨界融合处在新的发展和变化期,人工智能以他特有的魅力吸引学术界和产业界的支持和发展,我也觉得在新一轮发展中特别重要的是如何把它和产业结合,如何抓好它的商业扩散的方式。

 另外一个问题是创造性的问题,我在这里特别加了两页PPT,过去我们的科技技术都是在上世纪五十、七十年前的重大发明,我们现在的重大发明越来越少,新的一些技术还会带来问题。我想大家都有印象,当时在20世纪30年代的时候,一批年轻的科学家和一些重要的领军人士不断的开始在学术的创新和交叉性的讨论,也在那个年代创造出很多现代的科学和产业的基础,比如1948年控制论的形成,而在同时参加方法论聚餐的活跃人士都在一起,那时候有控制论的鼻祖,也有神经生理学家,信息论的鼻祖,还有博弈论的,电子计算机创始人,还有神经控制论的奠基人,都为现在很多人工智能的方式创造了基础。那个时候在自己独立分割的领域当中,大家的交叉和结合创造的。所以中国中文信息学会和计算机学会,坐在一起开这个会,李生先生特别讲到曾经在一起交流,我觉得不断的交流和讨论,创造新的智慧是人工智能发展的幸事,也是必要的事情。

人工智能正在走向成熟,也正在开辟产业化的发展,我觉得这个领域对社会的意义、对经济的意义都是非常重大的,值得我们去探索,同时也不要过度的浮躁,来把一切都进行简单的关联。理性和积极的推动它的发展,应该是我们科学的精神和理性的态度,再一次感谢李生理事长和高文理事长给我这个机会跟各位分享观点,谢谢各位!