MPP and Hadoop
对于MPP和Hadoop而言,很多人都会把两者放在一起进行比较,可实际上这两者本身应该不太具有可比性,因为并不完全是同类的产品,之所以会比较,可能是因为在特定的应用场景下,我们不知道也不清楚该如何从他们之中进行选择。
无论是MPP数据库还是Hadoop,其基础架构都是以分布式为基础的。MPP数据库本质上是分布式并行关系型数据库系统,而Hadoop并不是一个简单的单一系统或技术,而是一个生态系统,由多个组件和不同的功能构建起来。
MPP数据库的主要架构特点是:
●分布式,基于网格计算技术
●Shared-nothing
●DAS(direct-attached storage)存储特质
●数据分区以及本地处理
●数据压缩
●高性能网络链接
对于MPP数据库,它比较擅长的是:
●关系型数据
●批处理
●即席数据查询分析
●低并发场景
●ANSI SQL支持度高
而与之不同的是,Hadoop?比较擅长的是:
●一次写多次度
●100+以上节点集群规模
●支持关系型和非关系型数据
●具有非常高的并发性
批处理和分析负载
具有非常好的扩展性
下表对MPP和Hadoop进行了对比分析: