今年年初,两件事吸引到那些正持续关注全球人工智能发展的人们。其一是微软的高管陆奇在 1 月表示,自行车事故之后,他将不再回到这家全球最大的软件公司任职,而将担任中国最大的搜索引擎公司——百度的首席运营官。而第二件则是该月末,由于 AAAI (国际人工智能协会)年会的原定日期与中国春节相冲突,最终将会议推迟。
这些迹象表明,在一些人工智能至关重要的领域,中国有可能实现弯道超车,比如语音助手、自动驾驶汽车等。陆奇解释道,中国就是这样的地方,而百度也是最为重要的参与者。他说:「我们有机会领导人工智能的未来」。事实证明他所言不虚。2016 年 10 月,白宫的一份报告指出,在人工智能的分支深度学习方面,中国发表的相关期刊文章已然超越了美国。咨询公司普华永道预测,在 2030 年之前,与人工智能相关的发展将会促使全球 GDP 增长16亿美元;据估计,近一半的财源都将累积至中国。尽管美国在绝对数量上仍然领先,但近几年来,中国研究人员所提交的人工智能相关的专利申请数量增加了近 200%(如下图表所示)。
若要了解为何中国如此得天独厚,便应当考虑人工智能所需的投入。中国拥有丰富的两大基本要素——计算能力以及资本。从阿里巴巴与腾讯这样的巨头,到 CIB FinTech 与 UCloud 这样的初创公司,这些中国企业都在加快速度建立数据中心。据咨询公司 Gartner 报道,云计算市场近年来已增长了 30% 之多,且将持续增长下去。据智囊团乌镇智库统计,2012 - 2016 年,中国的人工智能企业获得了 26 亿美元资金,虽然低于美国同行的 179 亿美元,但总体而言仍在飞速增长。
然而,能使中国真正成为人工智能「应许之地」的还有两种资源。其一便是研究型人才。微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋( Harry Shum )表示,除了数学方面的强大才能,中国还有研究语言和翻译的传统。在阿里巴巴负责管理 150 位数据科学家的闵万里说,在中国发现顶尖的人工智能专家要难于美国。但他预测,由于许多大学都推出了人工智能计划,所以未来几年将有所改变。据估计,中国拥有超过世界五分之二的高素质人工智能科学家。
其二是数据,即人工智能最为重要的部分。软件和数字产品在过去大多都遵循代码所制定的规则,因而拥有顶尖编程人员的国家便更具优势。随着深度学习算法的出现,这些规则愈发以从数据库中提取出的模式为基础。可用的数据越多,能够学习的算法也会更多,人工智能产品也会因此而更加智能。
中国的人口等规模及数据多样性为这一循环提供了有力的燃料。仅靠日常生活,全国近 1.4 亿人口所产生的数据便多于其他几个国家之和。即便是一些罕见病,也不曾缺乏用来教算法识别这种病的病例。由于打汉字比西方国家的文字更为费力,因此中国人往往比西方人更倾向于使用语音识别服务,于是公司便拥有更多语音片段来改进语音产品。
数据富矿
真正能够使中国大放异彩的是,它拥有约 7.3 亿的互联网用户,超过了其他任何国家。几乎所有人都通过智能手机上网,而它们含有传感器且方便携带,产生的数据远比台式电脑珍贵得多。例如,大型沿海城市的人们已不再使用现金进行小额购物,而是通过移动设备用支付宝和微信支付等完成交易。
中国人似乎并不十分重视隐私,这使数据更易于收集。例如,以迅雷不及掩耳之势风靡大型城市的共享单车服务,不仅提供了实惠的交通工具,而且它还是一种「数据播放」。当乘客租用单车时,一些公司便可以通过车上的 GPS 装置追踪用户的行动。
中国的年轻人似乎十分热衷于以人工智能驱动的服务,对个人数据的使用也很放松。小冰是微软开发的一个开朗乐观的聊天机器人,如今她已拥有超过 1 亿位中国用户。他们通常会在夜晚 11 点至凌晨 3 点之间讨论白天遇到的问题。她会从互动中学习,从而变得更加智能。小冰不再仅限于提供鼓励或讲笑话,而是创作了第一部人工智能创作诗集「阳光失了玻璃窗」,这引发了中国文学界对于是否存在人工智能诗的激烈讨论。
在中国,人工智能的另一个重要支持者便是政府,这项技术在其目前的五年计划中地位显赫。技术公司正与政府机构进行密切合作,如百度已响应号召,领导国家深度学习实验室。但政府用清规戒律对人工智能公司加压的可能性微乎其微,中国包含个人资料保护相关规定的法律有 40 多条,但它们鲜少得以执行。