九种引人瞩目的开源大数据技术

Scribe于2008年发布,是一个由Facebook开发的日志聚合服务器软件,用于实时从大量服务器汇集日志数据。Scribe遵循Apache 2许可证,扩展性极佳,每天可应对数百亿日志记录的挑战。

5.ElasticSearch

ElasticSearch是一款由Shay Banon开发,遵循Apache许可证的开源搜索服务器。ElasticSearch基于分布式计算,对于实时搜索可以提供很好的可扩展性解决方案。许多公司已经对ElasticSearch表示认可,比如StumbleUpon和Mozilla。

6.Apache HBase

Apache HBase是一个使用Java语言编写的、以谷歌BigTable技术为基础的开源非关系型列式分布数据库,可运行在HDFS文件系统之上。HBase提供了很好的存储容错能力和快速访问大量稀疏文件的能力。HBase遵循Apache 2许可证。

7.Apache Cassandra

Cassandra是由Facebook开发的另一个开源NoSQL数据库,遵循Apache 2许可证。由于对HBase的喜爱,Facebook开始逐渐放弃使用Cassandra,但许多公司,如Netflix依然使用Cassandra数据库为其后端流媒体服务提供动力。