4月24日,百度公司宣布正式发布大数据引擎,将开放云、数据工厂、百度大脑三大组件在内的核心大数据对外开放,与百度合作的机构和传统企业将能够在线使用百度的大数据架构,处理自身积累的大数据,或融合百度大数据,来改造和优化传统行业的企业管理、产品服务、商业模式等环节。百度将在政府、医疗、金融、教育等传统领域率先开展对外合作。
开放大数据引擎
在当天百度第四届技术开放日上,百度首席执行官李彦宏重提互联网正在加速淘汰传统产业的观点,并补充道:“互联网几乎首先是颠覆了媒体,后来颠覆了零售,再往后是旅游,再往后是金融,金融可能现在才刚刚开始。”
“大约4年前,在百度的活动上同样来了很多传统产业的老板、企业家,我跟他们讲,我们这些企业家们今后要有互联网思维,可能你做的事情不是互联网,但你要逐渐按照互联网的思维方式去想问题。现在4年过去了,这种观念已经逐步被越来越多的企业家,甚至企业以外的各行各业、各个领域的人所认可了。原因是什么?是互联网正在颠覆各种各样的传统产业。其实这个趋势在过去几年一直在发生。”李彦宏说。
事实上,李彦宏要谈论的是大数据,“一方面互联网在改变中国,这个是过去时,甚至是现在进行时,可是我们怎么能够为未来时做准备呢?我觉得这就需要我们对技术,对大数据,或者以大数据为基础的互联网相关技术,有一个及早的了解、及早的认知、及早的拥抱。”
李彦宏特别提到了百度内部有一个叫做“百度大脑”的项目。据介绍,这个项目用计算机加上人工智能,以及深度学习的技术模拟人脑的思维,现在已经达到了大约相当于两到三岁孩子的智力水平。“这可能是世界上最复杂的模拟人大脑思维的系统。”
这个让李彦宏引以为傲的“百度大脑”,与开放云、数据工厂,共同构成了百度昨日发布的大数据引擎的三大组件。这个大数据引擎向外界提供大数据存储、分析及挖掘的技术能力,并通过深度学习技术和数据建模技术,使数据具有“智能”。这也是全球首个开放的大数据引擎。
谈及百度大脑,百度深度学习研究院常务副院长余凯更为自信。他介绍说,在整个自然界和生物的智能系统,智能的水平和大脑的神经元的规模是有相当的关联的。比如,自然界最大的神经网络系统是人脑,它拥有一千个神经元。而百度大脑的深度学习技术,现在已经有能力构建规模达到两百亿个参数的深度神经网络,这个是我们所知的在业界最大规模的深度神经网络系统。因而,百度在大数据处理方面,就能拥有其他公司所不具备的智能和能力。
率先用于传统领域
据了解,百度大数据引擎会逐步开放,目前采取邀请制和免费模式,将在政府、医疗、金融、零售、教育等传统领域率先开展对外合作。
发布会现场,百度大数据相关负责人和业界专家陆续登台,力图向在场的传统行业代表和外界传达这样一种信息:百度拥有强大的大数据存储、挖掘、处理能力,百度也将开放自己的大数据核心能力,与传统行业一同挖掘数据价值,加快传统行业的转型升级。
正如百度高级副总裁王劲所言,怎么让传统行业进入大数据时代,充分挖掘、利用大数据的价值,是摆在我们面前的新课题。百度主打的搜索引擎天然就是一个大数据应用,百度希望通过多年在技术上的积累,能够把大数据的技术,打造成一个大数据的引擎,提供给传统的产业。
在大数据的利用方面,王劲举了个例子,全球每年有几百万人患心脏病,如果我们的大数据中心有很好的计算能力,能从这些患病人群里找到共性,也许我们能提前一两天给他一个预警,让他来到医院做预防措施。从健康的角度而言,提前预防将极大地提高人们对抗疾病的能力。从保险公司的角度而言,也能极大地降低配需率。
有意思的是,在王劲看来,百度自身收入水平的提升也与公司在相关技术方面的提升息息相关。百度的搜索引擎用计算机学习的办法来预测人们的行为方法。大规模学习的能力有两个指标评估,第一是机器的规模,第二是它能处理的特征向量的大小。
据王劲介绍,4年前,百度机器的规模大概是几百台服务器,特征向量处理水平大概为十万左右。那时百度的收入规模大概在70亿元左右。两年前,百度的机器规模达到近十万台了,与此同时百度的特征向量也达到了历史的巅峰,当年百度的收入达到150亿元。