x86携手Hadoop 软硬结合击破大数据

  说过了性能,我们再来看看功能上的优势。英特尔Hadoop发行版一个重要的内容就是可以提供基于HBase数据大表的建立,同时结合分布式函数计算,使得运算效能得到多倍提升。

Hadoop应用与英特尔

  这里我们先来解释一下什么叫做HBase。所谓HBase就是Hadoop Database,它是一种高可靠性、高性能、面向列、可伸缩的分布式存储系统,而它的出现则可以帮助用搭建大规模结构化存储集群。

  在以往我们的使用中,HBase利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为对应。结合上图来看,Hadoop EcoSystem中的各层系统,其中HBase位于结构化存储层,Hadoop HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,Zookeeper为HBase提供了稳定服务和failover机制。

  但是在HBase使用的过程中,由于使用数据的用户数量及数据分布的不均衡,经常会出现系统根据服务器Region数量进行负载均衡,从而增加系统负担,导致系统变慢的问题。但是在英特尔Hadoop发行版当中,则可以智能的根据数据的局部性、分析服务器的Region数量的自动进行均衡设置,同时还可以实现跨数据中心的应用部署,解决运行速度的问题。从这一点来说,英特尔Hadoop发行版在功能上相比普通的开源软件更为强大,同时也降低了用户在应用中可以面对的风险和出现的问题,进一步提升了企业的运行效率。

  作为英特尔开发的特定收费版本,Hadoop发行版必然有着完善的管理界面,这也是与开源版本一个比较大的区别。在这里,英特尔特别为用户设置了一个可以通过浏览器进行管理的页面,提供了集群安装和管理,这也是它的亮点所在。当系统遭遇故障的时候,软件还可以自行报警,将故障邮件发送到预先设定好的管理员邮箱当中,第一时间完成报告。

  说了太多Hadoop应用的好处,下面我们可以来看一个具体的应用案例。来自美国国际绿色计算大会的消息,著名的国外社交网站FaceBook目前正在使用至强处理器组建自己的Hadoop开源服务器集群,这些集群已经在俄勒冈州Prineville的数据中心投入使用,同时当英特尔发布最新架构的至强E5-2600处理器之后,数据中心也将随之进行大规模的升级。

  如今,英特尔已经不再仅仅满足于从硬件层面支持大数据特别是Hadoop应用的普及,最新推出的Hadoop发行版更是为用户提供了一个最佳的选择。从前期的准备到后期的维护,英特尔提供了完善的技术支持,对于那些想使用Hadoop又没有能力完成开源软件编译的用户来说提供了最大的方便,同时英特尔Hadoop发行版所完善了HBase的诸多功能,在数据安全和冗余方面提供了更多的保障,而在应用层面了强化了用户体验,浏览器界面更为友好。

  开源软件虽然具备了免费的特质,但是较高的技术门槛也阻挡了许多切实需要的用户。对于国内的大部分中小企业来说,Hadoop的应用已经是大势所趋,但受限于技术能力和规模限制,很少有企业具备独立研发的能力。而从实际应用来说,英特尔Hadoop发行版就为这些中小企业提供了一个最佳的解决方案,不仅避免了它们在开发上的难度,更提供了完善的指导和售后服务,解决了技术应用上的瓶颈。