微软联姻Hadoop:剑指Windows Azure

微软最近宣布公司正在开发适用于Windows Server与Windows Azure的Apache Hadoop框架。

  Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。简单地来说,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。它受到最先由 Google Lab 开发的 MapReduce 和 Google File System 的启发。2006 年 3 月份,MapReduce 和 Nutch Distributed File System (NDFS) 分别被纳入称为 Hadoop 的项目中。

  Hadoop的核心之一是MapReduce,它是Google的并行计算引擎与环境,常用于传感器、社交(例如Facebook)、GPS定位为中心的流数据处理。“大数据”对今天企业的价值还体现在另外一方面。大型机构面临着维护海量结构化和非结构化数据。

  微软联姻Hadoop:剑指Windows Azure

  微软发布的Hadoop版本对于开源项目而言是一次伟大的贡献。微软宣布将从鼻祖雅虎分拆出来的Hortonworks合作开发,在Apache Hadoop上实现搭建Windows Server以及Windows Azure平台。作为微软的战略合作伙伴,Hortonworks拥有大象之名(“Hadoop”是根据发明人儿子玩具大象的名字而命名),将会借助专长将Hadoop集成到微软的产品之中。