最后一点,我想谈的是大数据发展对IT本身技术架构的革命性影响。大数据的根基是IT系统。我们现代企业的IT系统基本上是建立在IOE(IBM小型机、Oracle数据库、EMC存储)+Cisco模型基础上的,这样的模型是Scale-UP型的架构,在解决既定模型下一定数据量的业务流程是适配的,但如果是大数据时代,很快会面临成本、技术和商业模式的问题,大数据对IT的需求很快就会超越了现有厂商架构的技术顶点,超大数据增长将带来IT支出增长之间的线性关系,使企业难以承受。因此,目前在行业中提出的去IOE趋势,利用Scale-out架构+开源软件对Scale-up架构+私有软件的取代,本质是大数据业务模型所带来的,也就是说大数据将驱动IT产业新一轮的架构性变革。去IOE潮流中的所谓国家安全因素,完全是次要的。
所以,美国人说,大数据是资源,和大油田、大煤矿一样,可以源源不断挖出大财富。而且和一般资源不一样,它是可再生的,是越挖越多、越挖越值钱的,这是反自然规律的。对企业如此,对行业、对国家也是这样,对人同样如此。这样的东西谁不喜欢呢?因此,大数据这么热门,是完全有道理的。
三、新智慧生物的诞生?
下面的想象就更狂野了,真正要实现,估计至少是我们十辈子或者一百辈子以后的事情。那时候,我们已经是祖宗了哈。大家就当科幻小说来看好了。
从最近一位微软副总裁的演讲说起。瑞克·拉希德(Rick Rashid)是微软研究院的高级副总裁,有一天,他在中国的天津迈上讲台,面对2000名研究者和学生,要发表演讲,他非常非常紧张。这么紧张是有原因的。问题在于,他不会讲中文,而他的翻译水平以前非常糟糕,似乎注定了这次的尴尬。
“我们希望,几年之内,我们能够打破人们之间的语言障碍,”这位微软研究院的高级副总裁对听众们说。令人紧张的两秒钟停顿之后,翻译的声音从扩音器里传了出来。拉希德继续说:“我个人相信,这会让世界变得更加美好。”停顿,然后又是中文翻译。
他笑了。听众对他的每一句话都报以掌声。有些人甚至流下了眼泪。这种看上去似乎过于热情的反应是可以理解的:拉希德的翻译太不容易了。每句话都被理解,并被翻译得天衣无缝。令人印象最深的一点在于,这位翻译并非人类。
这就是自然语言的机器翻译,也是长期以来人工智能研究的一个重要体现。人工智能从过去到未来都有清晰而巨大的商业前景,是以前IT业的热点,其热度一点不亚于现在的“互联网”和“大数据”。但是,人类过去在推进人工智能的研究遇到了巨大的障碍,最后几乎绝望。
当时人工智能就是模拟人的智能思考方式来构筑机器智能。以机器翻译来说,语言学家和语言专家必须不辞劳苦地编撰大型词典和与语法、句法、语义学有关的规则,数十万词汇构成词库,语法规则高达数万条,考虑各种情景、各种语境,模拟人类翻译,计算机专家再构建复杂的程序。最后发现人类语言实在是太复杂了,穷举式的做法根本达不到最基本的翻译质量。这条道路最后的结果是,1960年代后人工智能的技术研发停滞不前数年后,科学家痛苦地发现以“模拟人脑”、“重建人脑”的方式来定义人工智能走入一条死胡同,这导致后来几乎所有的人工智能项目都进入了冷宫。
这里讲个小插曲。我读大学的时候,有个老师是国内人工智能的顶级教授,还是国内某个人工智能研究会的副会长。他评述当时的人工智能,不是人工智能,而是人工愚蠢,把人类简单的行为分解、分解再分解,再去笨拙地模拟,不是人怎么聪明怎么学,而是模拟学习最蠢的人的最简单的动作。他说,对于当时人工智能的进步,有些人沾沾自喜,说好像登月计划中人类离月亮更进一步了,其实,就是站上了一块石头对着月亮抒情,啊,我离你更近了。他对自己事业的自我嘲讽,让我至今记忆非常深刻。
后来有人就想,机器为什么要向人学习逻辑呢,又难学又学不好,机器本身最强大的是计算能力和数据处理能力,为什么不扬长避短、另走一条道路呢?这条道路就是IBM“深蓝”走过的道路。1997年5月11日,国际象棋大师卡斯帕罗夫在和IBM公司开发的计算机“深蓝”进行对弈时宣布失败,计算机“深蓝”因此赢得了这场意义深远的“人机对抗”。 “深蓝”不是靠逻辑、不靠所谓的人工智能取胜的,就是靠超强的计算能力取胜:思考不过你,但是算死你。