什么是大数据?什么是云计算?将怎样影响我们的未来生活与商业模式?百度认为,搜索正在“思考”和“理解”,而这一改变正是源于“云”。
大数据时代对搜索的影响
近年来大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据时代来临。截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。在资源优化的规则下,“云计算”成为替代“超级计算机”的经济型方案。
作为互联网搜索的入口,百度承载着数亿网民检索需求,满足海量计算的数据中心规模日益庞大。百度从软件架构、IT设备、数据管理效率等多方面入手,致力于绿色IT建设,将对产业链上下游的参与起到良好的示范和带动作用。“搜索引擎基于互联网的数据处理而生,更是天生的需要能对大数据进行处理的云计算。”百度技术委员会理事长陈尚义透露,“百度每天处理的数据量将近100个PB,1PB就等于100万个G,相当于5000个国家图书馆的信息量的总和”。
图片 1 央视解密云计算:计算能力可合可分
百度“接地气”的云 让用户智能生活更便捷
什么是百度的云?一方面是“云空间”“云内容”涵纳更广,另一方面是大数据计算能力更强,呈现效果更科学。例如,1994年Dr.Jill Ellsworth提出“暗网”的概念。指存储在网络数据库里、不能通过超链接访问,不属于那些可以被标准搜索引擎索引的表面网络。百度则令内容提供商可通过百度开放平台,接入自己的结构化数据,用户在搜索时即可在结果前位看到这些信息。百度如同神灯一样照亮暗网,大幅提升了用户体验。
图片2 云边一角——百度开放平台带来全新搜索体验
百度作为全球最大的中文搜索引擎,已有内容和每日新增内容浩如烟海,然而在海量数据面前,你不会不知所措。百度利用领先的聚合搜索、时效搜索、框计算等技术,分析更多用户行为呈现用户最想要的搜索结果。如搜某明星时,包括百度百科、图片、微博、最新消息、视频、贴吧等内容,都被百度搜索深度整合。此外,右侧的“其他人还在搜”等推荐,则展现了百度关联搜索的功效,便于让用户了解明星最重要“社交网络”。
图片 3 云边一角 百度搜索聚合用户所需
更智慧的搜索不需要“搜索”的搜索
由影帝尼古拉斯·凯奇主演的电影《NEXT》(预见未来),其神奇的预测能力给人留下深刻印象。但许多人没有想到的是,通过大数据和云计算,搜索也同样拥有预测能力。
以黄金周为例,通过对数以亿计网民的搜索分析,能预测出网民假期最想去的地方,当然也是游客最多的地方。2011年十一黄金周,百度数据中心发布的旅游行业报告中相关数据与全国假日办发布的数据完全一致。