新版Hadoop将大幅提高易用度


    为了缓解用户在使用开源Apache Hadoop分布式计算平台时所遇到的技术复杂性的问题。Hadoop将在新版本中进行改善。

    Hadoop分布式计算平台已成为海量数据分析的代名词,Hadoop可为用户带来更多便利。Hortonworks的公司的CEO Eric Baldeschwieler说到。(Hortonworks是Yahoo与硅谷风投公司Benchmark Capital合资组建一家名公司)


   “Hadoop的升级将会带来很多改善,例如高可用性以及安装和数据管理功能的改进。Beta版(Hadoop 0.23)将于今年晚些时候发布,0.23版在可用性、性能和可扩展性方面进行了改进。Hadoop 0.23版的目标将是非常大的客户,如Yahoo、Facebook。而稳定版可能要等到2012年。”Baldeschwieler说到。

    Baldeschwieler表示“我们工作的重点是要增加检测、分布式以及管理的工具,使用户更容易的使用Hadoop。现在问题是需要一个有相当丰富经验的人来安装并使用它。”


    此外,Hadoop 0.23计划采用新的HCatalog数据管理软件层,可以让用户将数据存储在一个相对传统风格的表中,并且用户能够透明的移动工具间的数据。另外Hadoop 0.23还完善了Hadoop MapReduce编程模型。目前,Hadoop上的Pig和Hive可供用户使用,Pig和Hive都拥有自己的专业数据存储。

    Apache已经确认将对Hadoop高可用性、数据管理等方面做出完善。但Apache还不能给出明确的时间和与之对应的版本。Hadoop到目前为止也还没有1.0版本代号的产品推出。Baldeschwieler表示随着Hadoop的完善,将来推出的版本将会直接被命名为1.0或2.0。