Cloudera近日公布了一项有益于合作伙伴生态系统的计划,使Hadoop的相关数据管理技术和服务在企业客户中广泛推广。公司COO Kirk Dunn表示Cloudera软件包包括开源分布式Hadoop的开发工具、技术支持、培训方案以及销售和市场资源,这将便于企业更容易的采取技术。我们希望帮助企业驱动数据,例如那些使用Hadoop处理公司中重要业务组成部分数据的企业。
Apache Hadoop项目是一个能够对大量数据进行分布式处理的软件框架。Hadoop有许多元素构成。最底层为HDFS(Hadoop Distributed File System)。HDFS存储Hadoop集群中所有存储节点上的文件。
Hadoop常常被用在云技术分析海量数据中,在使用中帮助企业发现如何更好的管理自己存储的数据。例如云供应商Yahoo、Amazon和Twitter都在内部使用Hadoop管理自己的数据。
企业不具备网络公司的数据量,同时网络公司也不具备企业多样化的数据。Cloudera已经将Hadoop软件包提供给企业,Dunn表示这是了不起的举措。
Cloudera的CDH像其他开源软件一样可提供免费下载。公司还推出一个面对硬件供应商、独立软件开发商和系统集成的软件包。
Cloudera的新硬件合作伙伴包括Dell、Cisco、Fujitsu、SGI和Mellanox。独立软件开发商包括Informatica、Microstrategy、Teradata和IBM。
Dunn表示我们要创建一个生态系统,以便硬件供应商、软件供应商以及系统集成商可以一起探索如何使用Hadoop更好的洞察数据。相信我们能够做到这一点,Hadoop已经迅速的被各领域采用。事实上Hadoop已经在过去几个月在各个行业得到了特别的支持,特别是随着企业的成长,他们对使用新的方法来处理海量数据越来越有兴趣。他们希望将数据扩展到PB级别,同时创建、收集和存储数据并实时协作。
EMC在5月为客户推出一种新的基于开源Hadoop解决方案的数据中心设备,以助其满足客户日益增长的数据分析需求并加快利用开源数据分析软件。EMC将通过一个基于分布式的Hadoop解决方案集成自己的Greenplum软件,从而可以在一个可扩展的设备里进行海量数据分析任务(GFS+Greenplum)。Greenplum是EMC在去年7月收购的一家开源数据仓库公司。
同月在NetApp在收购了Engenio之后,NetApp推出与Hadoop应用结合的产品E5400存储系统。
Calxeda公司在6月(之前公司的名字是Smooth-Stone)发起了“开拓者行动”,一个由10家软件公司组成的团队将为基于Calxeda即将推出的ARM系统上芯片设计的服务器提供支持。并为Hadoop提供低功耗服务器技术。
数据集成供应商Informatica也在6月份发布了其旗舰产品,产品设计初衷是处理当今事务和社会媒体所产生的海量数据,同时支持Hadoop。