人工智能十年:风起于青萍之末

文/吴恺 BAI(贝塔斯曼亚洲投资基金)投资经理

一、人工智能悄然兴起

“人工智能”涵盖了很多前沿技术和分支,却很难用一句话来定义,因为它一直处在发展当中。比如,一些在过去看来很“人工智能”的事情,现在却变成了简单的“机械重复”,像是数字的高速计算、图像的处理等。但总体上来看,“人工智能”的本质和目的一直没有发生太多变化,那就是“完成人类的部分脑力工作”。

20世纪60年代开始,就有许多科幻电影和科幻小说描述着人类对“人工智能”的憧憬和恐惧,比如斯皮尔伯格的知名影片《人工智能》。不过在现实中,长久以来,受到技术、科技发展和应用层面的限制,人工智能只是一件人人都在说,都以为别人在做,但事实上却没多少人知道该怎么做的事——无论在学术研究层面还是在应用层面都是如此。

人工智能曾经在20世纪90年代互联网泡沫破裂前风靡一时,到了21世纪伊始却变成了一个禁忌,大家开始怀疑它是否存在。而到了2011年,美国资本市场再度为人工智能而疯狂。风险投资机构和顶级科技公司们开始频繁投资这个领域的创业公司,投资范围从应用层面的机器人、增强现实,到底层技术层面的深度学习算法、神经网络芯片等,人工智能项目也遍地开花。比如,Google接连投资了虚拟现实创业公司Magic Leap,收购了人工智能公司DeepMind;Facebook收购语音识别公司Wit.ai,等等。

除了投资外部团队之外,像IBM、Google、Facebook和百度等国内外科技巨头们也纷纷加强自己的人工智能方面的专业团队,招募了一批人工智能尤其是深度学习相关领域的科学家,如深度学习鼻祖之一Geoffrey Hinton加入了Google,Yann LeCun加入了Facebook担任人工智能实验室负责人,Andrew Ng(吴恩达)加入百度负责深度学习研究院等。

二、驱动人工智能发展的内外动因

“人工智能”的再度兴起并非偶然,外部环境和人工智能自身都在发生演化。我们认为,驱动人工智能领域发展到现在程度的外部动因有:

1.传感器能力和数量的大幅提升:LIGA等微电子技术的日趋成熟,推动着传感器的能力有了质的飞跃,而大量智能设备的出现则进一步加速了传感器领域的繁荣。这些延伸向真实世界各个领域的触角是机器感知世界的基础,而感知则是智能实现的前提之一。

人工智能十年:风起于青萍之末

2.计算成本的大幅下降:摩尔定律使得计算成本在迅速下降,同时云计算的出现、GPU的大规模应用使得集中化的数据计算能力变得前所未有得强大。大规模的的集中式计算使得人工智能的发展速度指数级加快。过去仅训练深度神经网络模型对某一物体的认知就要花费近一年时间,而现在这个时间被缩短到几天内。

人工智能十年:风起于青萍之末

3.海量数据的出现:根据预计,2015年全球产生的数据总量将达到十年前的20多倍。如此海量的数据给机器学习的提供了足够多的素材(但是需要注意的是,在其中真正有标注的数据不超过总量的10%)。

人工智能十年:风起于青萍之末

当然,更重要的驱动因素是内因——算法的进步。当下人工智能领域最先进、应用最广泛的核心技术是深度神经网络(深度学习)。而且,直到2006年,深度神经网络才得到快速发展,逐渐成为人工智能领域的主流研究方向。

21世纪人工智能的里程碑事件之一是,2006年Geoffrey Hinton发表的论文《A fast learning algorithm for deep belief nets》。他在此文中提出的深层神经网络逐层训练的高效算法,让当时计算条件下的神经网络模型训练成为了可能,同时通过深度神经网络模型得到的优异的实验结果让人们开始重新关注人工智能。之后,深度神经网络模型成为了人工智能领域的重要前沿阵地,深度学习算法模型也经历了一个快速迭代的周期,Deep Belief Network、Sparse Coding、Recursive Neural Network, Convolutional Neural Network等各种新的算法模型被不断提出,而其中卷积神经网络(Convolutional Neural Network,CNN)更是成为图像识别最炙手可热的算法模型。

目前,随着GPU和CPU集群的出现,云端的计算资源已经慢慢不再是人工智能的发展瓶颈。而人工智能算法模型的进一步丰富和改进以及本地化人工智能的实现成为了人工智能新的主要发展方向。

三、人工智能的三步走

从人工智能的整个发展历程来看,按照应用场景和人工智能资源的集中度,可以大致分成三个阶段。

第一阶段:实验室研究阶段,这一阶段的人工智能资源高度集中。人工智能在2011年前的发展大致还处于实证研究阶段,资源高度集中在国家或大学资助的研究机构中,用于算法模型的训练和研究,人工智能还只能为极少数人接触到。这一阶段大量的工作除了在算法模型本身的研究外,还包括建立计算能力本身。

第二阶段:企业应用阶段,这一阶段的人工智能资源被少部分科技巨头掌握。在人工智能表现出一定的实际应用价值后,科技巨头们一拥而上,纷纷希望在这个领域取得突破。在少部分核心企业掌握了大规模的人工智能资源以后,其它小规模的企业一般会利用这些核心企业提供的人工智能资源接口和其支持的人工智能应用为自身的发展提供服务。由于掌握大规模的计算资源是这一模式的前提,因此这一阶段人工智能资源的集中度仍然非常高,而这将是人工智能在企业场景下的主要应用形式,即集中计算,分布使用。

第三步:个人应用阶段,这一阶段的人工智能资源被分散到个人手中。显然,依赖于云端大规模计算资源的人工智能算法限制着人工智能在消费者场景的应用,因为集中式计算意味着巨量的网络资源消耗,并且因为网络问题,难以在消费者应用场景中有稳定的表现。因此,人工智能的本地化,也就是从集中走向分布(细化到智能手机、可穿戴设备等)实现将是人工智能在消费者场景中得到普及的关键一步。伴随着人工智能的本地化实现,将使得人工智能真正延展到手持设备、家用电器、汽车等消费级应用。

人工智能十年:风起于青萍之末

人工智能本地化实现的难点在于本地的计算能力在如今动辄几个G的算法模型面前杯水车薪、无能为力。一部iPhone 6手机采用一般的CNN算法去处理一张200*200像素图像的ImageNet千分类问题需要的时间是300毫秒,但这样的处理速度对于用户体验来说是灾难性的。要提高本地的图像识别处理速度,目前能够想到的途径有三条:一是精简算法模型,根据实际的场景适配需要的精度,让模型尽可能简化,二是提升CPU的计算能力。目前的智能手机CPU已经在20nm制程以下,按照传统路线,CPU提升的极限可能在7-10nm,这其实非常有限。而且,大功耗也是一般移动设备难以承受的,因此只有为人工智能算法模型重新开发专门的芯片才有可能满足本地的计算要求。

从这个角度来看,人工智能在消费者场景实现的关键是对算法模型优化和用户场景的综合理解,以及底层硬件的设计制造。而人工智能的企业应用则会是巨头们的游戏。

四、人工智能的产业生态

人工智能产业主要由底层可应用技术(图像识别、语音识别、自然语言处理、硬件技术等)、计算资源(大规模GPU集群)、基础数据服务,以及企业/政府/消费者应用组成。遵循产业的一般发展规律,人工智能的发展路径仍然是从底层可应用技术的成熟开始,再到商业化计算资源、数据服务等基础设施的完善,最后形成企业和消费者应用的繁荣。

人工智能十年:风起于青萍之末

目前还是人工智能的早期阶段,我们需要关注的是三方面的发展:一方面是底层可应用技术的突破,包括算法的和硬件的;另一方面是中间的数据服务和计算资源利用的进步;最后也是最重要的是,基于现有技术的应用场景的发掘。其中,底层技术不一定是“独门秘技”,能够把底层技术商业化的公司一定是因为自身的成本曲线优于大部分用户的成本曲线。如果不满足这个特性,那么某些企业即使有短暂的技术领先,最后都难以实现大规模商业化。

五、风起于青萍之末

乍看上去,人工智能是个巨头间的游戏,巨头企业无论从资本、人才还是技术积累上似乎都更有优势。然而事实未必如此。如果以汽车行业做类比,汽车电动化的先驱并非宝马、大众这样的传统汽车巨头,而是特斯拉这样的“小”公司。这其中的原因在于,大公司面对创新变革时,往往看不上小机会,因为小机会对它们的吸引力实在太小了。巨头们往往喜欢憋大招,喜欢一步到位,从而彻底甩开竞争对手。但是创新、特别是针对大众消费者的创新却是循序渐进的,所谓“大招”中其实包含着不少对用户需求的错误假设。小步快跑,不断寻求和用户互动,积跬步终能致千里。因此,创业公司在人工智能的创新变革中反而会更有机会。从Google和Yahoo在搜索领域,到Facebook和MySpace在社交领域,再到Apple和Nokia在手机领域,最终变革的主导力量其实都是“小”公司。

基于这个方向判断,有志于在人工智能领域挑战巨头的创业者们需要先想清楚三件事:

一、人工智能改变了什么。伟大的产品或技术一定是改变了消费者在某些场景下的行为,有没有都一样的产品,很难给消费者使用它的理由。人工智能相关产品核心是要能够替代一部分人的功能或者提高人的效率,那么在这个大前提下要考虑两个小问题,第一个是,产品对应的用户场景下人的介入频次高不高,频次决定了这个产品的天花板。第二个是,这个应用场景下替代掉的人的价值有多大,显然替代掉的这部分价值转化成了产品的内在价值。最后不妨做一个乘法,把产品所替代的工作/操作的频次乘以每次工作/操作能够产生的价值,这个乘积越大说明人工智能在该应用场景中发挥的作用越大。

二、该方向上的人工智能是否能够实现。人工智能的许多技术都还没到非常成熟的地步。之前提到,创业者的优势在于小步快跑,因此在人工智能还不成熟的领域,一味追求技术上的突破来解决所有问题并不可取。无法解决一个通用场景就从几个专门的场景先入手,无法做出一个“万能”的产品不妨先做出一个可以用的产品。只有用户使用了产品并给予反馈,才可能真正知道自己产品的缺陷和下一步的方向。

 三、人工智能能否成为该产品的核心竞争力。核心竞争力是一个产品的拳头,如果拳头不硬,这个产品无疑打开不了市场。因此产品的核心竞争力如果是人工智能,那么该方面的人工智能必须是完美适用于该特定场景的。如果产品倚重的是还存在很多瑕疵的人工智能技术,那么这个产品本身的被接受程度就会很不理想。但不要笼统地认为人工智能技术的某些局限会成为产品的绊脚石。以特斯拉电动车为例:电池性能至今还在很多方面限制着电动车的表现,依然有很多用户青睐特斯拉,原因是特斯拉的核心竞争力在于它出色的启动、智能化的驾驶体验和简易的维护,电池尽管是一个短板但不是核心功能。因此,关键仍然在于定义自己的核心竞争力,并确保在核心竞争力上的技术是经得起推敲的。

人工智能已经走出了象牙塔,在企业和消费者端的应用有了显著进步。但这仍然不够。如何让消费者手中的设备拥有尽可能多的处理能力,需要技术和应用的双端突破,这也正是人工智能领域创业公司的机会和任务所在——人工智能之风,在未来会起于青萍之末。

作者邮箱:kai.wu@bertelsmann.com