微软对于大数据的三个观点

似乎大数据这个工具让我们非常惶恐。除了基础设施的费用,还要雇佣那些能够从各种来源得来的大量非结构化信息中,发掘可行性操作意见的科学家。

但也许大数据并不如你所想象的那样吓人。根据微软的消息,它准备把自己定位为一个大数据企业,利用商业智能(BI)工具为企业服务。

例如,该公司最近发布了2013 Excel数据资源管理器的预览版,这是一个自助BI插件,它能够更好的服务于日常业务工作人员(不仅仅是数据科学家),使得他们能够更容易的从Hadoop这样的大数据平台等多种来源得来的数据里发掘价值。

微软最近还宣布推出SQL Server 2012并行数据仓库(PDW),这是一个专为Hadoop的整合而设计的大规模并行处理数据仓库设备。

这给我们带来了有关大数据的困惑:它们究竟是什么?微软会怎样利用它?

第一个观点:微软的SQL Server总经理在其最近的博客里面写道,企业的IT堆栈很难支持大数据,因为这必然带来基础设施和可扩展性方面的困境。

一个组织可能并不需要大数据解决方案所需要的服务器以及其他硬件的机架。Kelly表示说:“相反,一个实惠的解决方案应该提供存储和处理大量数据的能力,同时消除任何前期基础设施的成本,因为你只支付了你所需要的存储和计算能力。”

微软的Windows Azure HDInsight Service就符合这样的描述,我们对此一点也不感到奇怪。但Kelly的意见对于那些货比三家、想从其他供应商获得大数据解决方案的企业仍然是有用的。

微软发表的第二个观点是即将到来的数据科学家的短缺:企业不能找到足够合格的大数据大师,从如社会媒体内容和机器的传感器数据这样的非结构化信息源中,发现前瞻性的见解。

Kelly说:“这个行业需要更多的数据科学家,虽然现在大多数机构都配备了他们所需要的员工,能够帮助他们从数据中提出宝贵的见解,从而改善他们的业务。”

换句话说,大数据的工具和应用程序在当今是够用的。微软的说法主要是基于所谓的数据运动的民主化。流行的工具,如Excel数据浏览器插件(Excel with the Data Explorer add-in),能够允许终端用户直接进行(商业智能)BI分析,而不用IT的帮助。

第三个观点:大数据是机会,也是挑战。

OK,这可能听起来像市场营销的胡言乱语,但这里其实是有几分真实的。实现大数据平台,既是一个大难题,也是一个重要的机会。但是,不要让前者阻止你追求后者的步伐。

微软的技术研究员戴维·坎伯说道:“我经常问自己,大数据的最终价值在哪里以及我应该怎么进入。在我的脑海里,这两个关键点无非是时间洞察力以及可访问数据的回报率。这两个关键点,又反过来帮助信息生产的过程。”

Campbell表示,信息的生产是将数据从一个域转移到另一个域的过程。良好的信息生产工具使企业能够在更短的时间内获得业务洞察力。有了大数据这个工具的加入,你就拥有更广泛的结构化和非结构化数据去发掘。他表示说“这些工具可以让你非常迅速地从直觉阶段跨越到验证阶段。”