关于人工智能的二十件事

编者按:本文作者ZAVAIN DARLux Capital投资人。

有关人工智能:

1.过去二十年,在大数据集的数字化、建立管理大数据集的基础框架和大数据计算范式上的进展,是解释本世纪先后将重点放在数据科学和人工智能上的主要原因。

2.一旦我们数字化了数据,使得他们可以被程序处理,下一步就是撬动自动化和对未来的预测。随着预测能力的增加,似乎更多“智能”的方面展现了出来。于是我们将“数据科学”这样的术语改为“人工智能”。事实上这二者之间并没有什么明显的差别,只是感觉上的新奇和困难程度不同而已。新奇度和难度随着时间是呈正态分布。今天“人工智能”给人的感觉就和昨天的“数据科学”一样。

Image title

3.从数据中学习的AI叫做机器学习(Machine Learning)。传统的机器学习从原始数据中提取人们可以识别的特征,然后通过学习这些特征产生一个最终的模型。

Image title

有关深度学习:

4.过去十年中,神经网络,一种类似哺乳动物大脑突触连接关系的机器学习结构,得以复兴。神经网络不需要人为提取特征。原始数据进入学习算法之后不需要任何的人为工作,我们把它称之为“深度学习”。

5.尽管深度学习技术和学习模型已经存在了几十年了,但是我们现在才看到其理论创新和基于经验的突破,因为基础架构和数据的实用性才刚刚成熟。2006年,NVIDIA推出基于GPU的CUDA开发平台,成为了深度学习发展历史上的风水岭。

Image title

6.正是由于深度学习脱离了人为构建特征使其得以成为一种自然的学习工具。很多技能,早在有能力以复杂的数学方式提取特征之前,我们就已经学会了。这些技能是我们自然而然学会的,难以用高度的特征归纳。通过传统的机器学习手段,是很难凭人类的直觉得出,或是构造出高维的精确特征的。

7.早在我们有能力构建复杂的语义(semantic)之前,我们就已经在机器视觉和自然语言处理等方面取得了很好的成绩。但是学会这些技能不需要我们有数学推理的能力,更不要说人为有意构建的高层语义了。

8.深度学习在广义的高维机器学习问题上已经展现了突破性的成果。其中覆盖的领域包括基因组学,油气,数位病理学甚至是公共市场。

有关强人工智能(Artificial General Intelligence,AGI)

9.近期关于人工智能的不实传言引发了人们对于AGI的争论。AGI是人们假设出的拥有像人一样的智慧的计算机,各方面都能和人类比肩的强人工智能。

10.这很大程度上得益于深度学习在基本的人类技能上取得的重大突破和进展。比如机器视觉和自然语言处理等。

11.在未来一段时间内,这些努力都会被存于各个筒仓之内,也就是说不同小组之间相互独立地在各自领域内努力着。

12.会使我们开发AGI的速度遭遇瓶颈的,并不是任何一个筒仓,而是让他们彼此协作的能力,和建立合适的联系外界的输入输出通道。第一款AGI不会是一个有人类实体的机器人,而会出现在网上,这样它就可以接收世界上的知识,拥有通过网络的交流能力。

13.AGI会拥有类似人类的智力,但是却不会有类似人类的外表,因为我们并不了解自己内在的“目标函数”。目前,我们在特定的领域内训练计算机,使他们犯的错误最小化。除非我们知道我们自己的目标函数是如何校准的,否则,即使AGI会很智能甚至有可能会有意识的展现,但也绝对不会完全像人一样。

14.2025年以后出生的小孩会认为软件是有自己的意识的。这比大多数人想的都要来的更加突然和迅速。

15.人们会通过输入输出的通道来限制和规范AGI的行为。未来会有很多关于AGI善恶的争论,关于增加其好的能力是否会同时使其产生潜在的恶意行为。无人驾驶汽车是一个早期、但是很有力的例子。

有关人工智能公司:

16.AI创业公司正处在创新和获得资金增长周期之中。

17.AI学习技术和算法的商品化速度远比我们想象的快。目前比较成功的创业公司,都获取到了独特的数据,并且不断地利用AI模型从用户和企业之间的交互学习,加强他们的初期优势。比较著名的例子是Google通过点击率数据,将其作为一个私有的数据源和一种学习交互方式来帮助他们改进排名。

18.我们仍然在人工智能的春天。大科技公司会付大笔的钱收购那些有新成果的小团队。这些新的成果,如果最后在外部成熟,对大科技公司来说会产生生存危机,这为我们看到的这些高价收购提供了合理的解释。

19.提供人工智能工具的公司需要建立更有吸引力的平台来对抗“商品化”,从而获得值得资本投入的成果。

20.未来五年,硅谷的言论会发生改变,从Marc Andreessen的“软件在吞噬这个世界”变为“数据科学和人工智能在吞噬这个世界”。

本文编译自:beardedbrownman.com