大数据存储领域的八位明星

DataDirect Hadoop Apache Hive Driver

Hadoop最令人着迷的特性之一在于将非结构化数据转化为足以补充传统分析工作情报缺失的宝贵资源。这项挑战的难点在于如何将Hadoop当中存储的数据与现有商务智能及数据分析工具相对接。而根据Progress DataDirect公司数据连接部门副总裁Michael Benedict的说法,DataDirect driver for Apache Hive号称是惟一一款能够在多套Hadoop发行版中实现开箱即用的全兼容式驱动程序。

“如果没有DataDirect Hive Driver的帮助,我们很难想象该如何访问并分析数据——Hadoop的容量如此庞大,用户几乎无法访问、尤其是快速访问到自己需要的信息,”Benedict指出。“而DataDirect Hadoop Driver的意义正在于帮助用户以实时方式从Hive Data Warehouse中访问信息、进而简化数据分析的难度。”

Adaptec HBA

PMC-Sierra公司刚刚为大数据存储发布了一款主机总结适配器(简称HBA),这就是Adaptec 71605H总线适配器(或者被称为Series 7H)。这些PCIe HBA在良好的兼容性前提下带来了高性能I/O与低延迟表现。它们利用PMC的PM8018 16x6G SAS协议控制器并支持SAS与SATA接口。它们还能够最高接入16款固态硬盘或磁盘驱动器。HBA每秒能够执行超过百万次输入/输出操作(即IOPS),数据持续吞吐量则达到6.6 GB每秒。

“HBA最重要的适用范围在于数据中心环境下应对大量接入存储驱动器的同时,还要为持续增长的数据容量提供高密度存储与低成本维护,”PMC公司企业存储部门产品营销主管Zaki Hassan表示。“Seris 7H HBA在可用端口数量方面达到市场同类商业解决方案的两倍。这些端口数量庞大但却更加低调的HBA帮助数据中心将压缩运营成本、优化存储连接变为可能。”

Attunity RepliWeb for Enterprise File Replication

Attunity RepliWeb for Enterprise File Replication (即企业文件复制,简称EFR) 解决的是大数据技术面临的另一个重要课题——如何对大规模存储数据进行复制。它的设计目的在于简化数据文件在Apache Hadoop数据集合之间的复制流程。Attunity公司全球营销副总裁Matt Benati解释称,Hadoop平台在设计初衷上只考虑到大量数据消耗状况;然而某些企业可能还保留着一些较小的数据段,希望将其与大数据结合以进行更加精确的业务分析。Attunity公司能够帮助这类企业用户打理好从各类渠道进入Hadoop、有大有小的多种数据集。

“在合理的时耗之内通过广域网移动数据绝非易事,”Benati补充道。“Attunity公司的内存内数据流处理能力及相关技术优化使得大数据迁移更加轻松——无论是在本地还是云环境之下。”

Shadoop

Hadoop各款开源发行版在安全功能方面的关注并不突出,针对这一状况,商业发行版也就应运而生。这类发行版通常会把访问控制及登录等机制纳入进来。“Shadoop为Hadoop集群带来了以角色为基础的访问控制机制,具备日志审计及Kerberos(由麻省理工学院开发的一套安全认证系统)验证功能,” Enterprise Management Associate分析师Scott Crawford解释道。