IBM缔造的大数据分析帝国

你一想到大数据分析(Big Data Analytics),说不定会想到新兴公司。请再想一想。IBM早已涉足这个领域,可能做得比其他任何公司都要好。

IBM的Deepak Advani

IBM正在大数据领域取得极大的成功。其IBM大数据网站(http://www-01.ibm.com/software/data /bigdata/)是一大资源,其电视广告体现了权威性,其产品在这个领域确立了牢固地位。但是在我看来,近日与IBM商业分析产品和解决方案副总裁 Deepak Advani深入交谈之后,才对IBM的大数据战略有一个全面的认识。

  谁的新把戏耍得最好?

IBM是一家历史已有101年的公司,总部设在美国东海岸。它生产过打字机,如今仍在制造大型机。其产品能够与开源技术协同运行,但是大部分产品根本不是免费的。而那些产品中有许多来自这家公司在发展过程中先后收购的一连串公司。除此之外,IBM还是一家服务公司,大批顾问遍布全球各地。

相比之下,大数据领域的新兴公司大多有一支精简的团队,成立才短短几年时间,总部往往设在美国西海岸,提供的核心技术往往是在廉价的大众化硬件上运行的开源软件,并在内部逐步开发知识产权。不过,IBM仍是大数据和分析领域的大玩家。既然IBM那么多重要的统计数字显得与角逐这个领域格格不入,怎么会是这样子?与Advani的一番交谈让我想起了其中的几个原因,他还指出了我所不知道的另外几个原因。他帮助我明白了彼此之间的关系,更清楚地了解来龙去脉。

  真正的收购史

比如说,我知道过去的十年IBM在商业分析领域收购了多家公司。其中一起特别容易记起来:IBM在2007年收购了商业智能领域的重量级公司 Cognos——而同年早些时候它刚刚收购了Applix。这笔交易让IBM拥有了一款端到端商业智能套件,包括传统的和内存中的联机分析处理 (OLAP)、报表、仪表板和数据可视化。这个我很清楚。

但是我不清楚IBM的其他一些收购案,而带来整合分析价值的其实是所有收购案的共同成果。在收购Cognos之前,IBM还在2005年收购了 Ascential软件公司,因此为IBM带来了抽取、转换和加载(ETL)产品DataStage及其他资产。收购Cognos之前,IBM在2009 年并购了统计和分析重量级公司SPSS,在2010年并购了大规模并行处理(MPP)数据仓库专业厂商Netezza。

所以除了完整的商业智能套件外,IBM还拥有为那些商业智能系统输入数据所必需的高性能数据仓库技术以及对输出结果执行预测分析所必需的工具。说到分析,这是个与风险管理密切相关的领域。考虑到这一点,IBM在2010年和2011年先后收购OpenPages和Algorithmics更是极其有力地促进了其大数据战略。

上面这些只是IBM在商业分析领域拥有的其中几款产品。实际上它有众多的产品,正如Advani向我解释的那样,IBM有一项完整的“特色解决方案”计划(http://ibmdatamag.com/2012/07/ibm-smarter-analytics-signature- solutions/),旨在突显IBM在该领域中更值得关注的产品组合,以及由其服务部门围绕这些产品开发的知识产权。

 

既有自主开发的产品,也有从外面收购的产品

IBM能够与来自外界的开源技术协同运行吗,哪怕这些开源技术明明与它自己的一些产品相竞争?当然能。IBM可与R(实际上是SPSS的竞争对手) 协同运行;它与Cloudera(其Hadoop发行版与IBM自己的同样采用开源技术的Hadoop发行版相竞争)有合作伙伴关系,并且可以使用 Mahout,而Mahout是在Hadoop上运行的机器学习组件。当然,另外还有Linux,多年来IBM一直在战略性地使用这款开源操作系统。

IBM在分析领域也有许多内部自主开发的产品。InfoSphere Streams和InfoSphere BigInsights就是两个例子,前者是一款复杂事件处理(CEP)解决方案,而后者是IBM自己的Hadoop发行版。BigInsights Hadoop发行版方面值得关注的一点是,它与IBM的DB2关系数据库管理系统集成,DB2数据库管理系统是业界最重要的数据库管理系统之一。虽然关系型数据也许不是大数据,但是之前取得的成就为之后获得成功奠定了基础。知道如何实际处理数据为以后分析数据建立了平台和能力。

这还涉及硬件。IBM与大型机以及在大型机上运行的庞大后台系统之间几乎可以划上等号,数十年如一日地收集数据。如此长久地处理拥有这种工作负载的系统使得大数据成为IBM眼里的一个具体概念。IBM不仅仅制造产品,请客户想象他们通过其产品处理哪几类数据。想象力虽好,但是数十年的丰富经验显得更为重要。

  关注的不仅仅是产品,还关注人

由于在数据分析领域拥有如此庞大的产品系列,很容易忘了人力资源。但是人在IBM的大数据战略中的角色恐怕比产品还来得重要。首先,IBM拥有强大的科研力量,包括Advani告诉我的私有行业最庞大的数学运算部门。这显然为IBM在预测分析领域提供了强大的能力。

另外就是IBM早在2002年就收购了普华永道会计师事务所的咨询部门。甚至早在这笔交易之前,IBM就拥有一个举足轻重的全球服务部门,但是收购普华永远咨询部门大概使阿蒙克(注:IBM总部所在地)由一家设有服务部门的产品公司,变成了充分利用其母公司一大批自有产品的服务公司。

Advani跟我提及了IBM的另一个分析项目,名为分析决策管理(http://www-142.ibm.com/software /products/us/en/category/SWQ60),该项目致力于把分析功能嵌入到商业应用软件中,而不是迫使一线员工深入到专用、孤立的分析应用软件,来分析及获取那些宝贵信息。举例说,这个项目让呼叫中心的员工得以了解推销什么样的产品适合某些来电客户;推销出去后,结果可能会是怎样。这些应用软件的用户甚至没察觉到自己在运用分析技术,因为它嵌入到了操作工作流程中。很显然,IBM结合自己在科研和服务交付方面的经验加强了在这类一线员工场景下满足需求的能力。

与Advani的对话确实让我大开眼界。多年来,我一直在关注IBM制造产品、收购公司;我明白它热衷于大数据和分析领域。但是我在头脑里根本没把这一切串联起来。IBM处于独特的位置,正在大数据领域做竞争对手做不了的事情。

  蓝色巨人不好当

在IBM听来,下面这番评论同样带一点羞辱性:其他技术公司、尤其是新兴公司希望怎样打造一个类似的数据分析帝国?IBM又将如何管理这么多迥然不同的产品、技术、咨询团队和收购过来的公司?毕竟,庞大帝国大多数最终渐渐走向衰落。

在我看来,在发布新版本产品的同时,IBM需要把其产品系列整合起来。在商业智能方面,我已看到这一幕开始出现,IBM需要再接再厉。与此同时,小规模的新兴公司不用操心管理如此多的不同组件;说到开辟和推动创新技术以及围绕这些技术的市场,这些新兴公司必不可少。大数据就是这方面的一个佐证。

不过最终,这个行业需要整合。大数据领域会日趋成熟,更多的企业级软件公司会进入该领域,它们会收购一些新兴公司,整合就会随之出现。新兴公司让我们看到了理想主义、开拓新领地的重要性;而IBM的状况让我们看到了把大数据与企业级软件和主流服务组织相连接的重要性。它还表明了把分析功能嵌入到让人觉得看似普通的业务软件带来的显著优点。

尖端创新至关重要,但是只有整合到主流的工具、产品和公司当中,它的价值才会充分体现出来。