VMware的Hadoop大数据战略:精明还是错误?

尽管很多IT部门希望托管应用,在云端处理极大量的数据,最流行的“大数据”平台需要专注于硬件,因为其可能导致可靠性问题。

这个问题可能会随着VMware的Apache软件基金会(ASF)的开源项目Serengeti而改变。这个项目将允许企业在云端和虚拟环境中,在vSphere 5.0上部署和管理Apache Hadoop.

虚拟基础架构云上的Hadoop消除了可靠性问题;通过vSphere,Hadoop应用如果节点失败能够自动重启。

此外,虚拟化巨鳄也正致力于同Hadoop社区成员合作,包括Cloudera Inc.、Greenplum、Hortonworks、IBM,继续致力于ASF的可扩展性,这也是Hadoop“虚拟化感知”的要害所在。

VMware的Hadoop战略:精明还是错误?

一些人表示VMware在vSphere上适应Hadoop是明智的,而且会成为大数据领域的竞争者。

“随着大数据每天都在变得更大,很明显对于大数据消化的工作负载就存在明显的虚拟化机遇,”Al Hilwa表示,他是IDC应用开发软件项目总监。

大数据平台像Hadoop和其他的分布式数据库在VMware的vFabric应用软件中是缺失的现代应用堆栈部分,Jeffrey Reed说道,他是Logicalis Group的应用开发经理,该公司是一家英国的云提供商。

“如果VMware不提供起自己的Hadoop或者类似Hadoop的解决方案,其围绕Hadoop的战略就十分关键,这是分布式厂商的生态环境,”Reed表示。

然而,并不是所有人都同意分析师的观点。

“VMware对于高度可用的Hadoop的战略是一种误导,”Orchestratus的CEO Shlomo Swidler表示,“它通过基础设施层级支持提供高可用性,然而,软件层级的HA是现代应用的基准,”Swidler补充道。

“最重要的是让Hadoop成为优秀的企业公民,”Tony Baer表示,他是研究公司Ovum的首席分析师,“Hadoop容错不好,虚拟化是协助实现那个的技术之一,”Baer补充道。

Serengeti可以通过Apache 2.0许可证免费下载,允许管理员在一分钟内用单击完成Hadoop群集部署。

此外,VMware正致力于同Hadoop合作伙伴共同改变Hadoop分布式文件系统和Hadoop MapReduce开发。上月,VMware也宣布支持在OpenStack支持其Cloud Foundry.