你应该知道的大数据领域的12大动向

最近这几周大数据领域可谓动作频频,初创公司和老牌企业都纷纷发布新品,更新或改进现有的产品系列,以及达成战略性关系。

行业观察人士表示,许多企业拿来试点阶段的大数据系统(尤其是那些整合Hadoop平台的系统)后,将它们部署到更广泛的生产环境。本文介绍的新闻主要旨在帮助公司进行这种转型。

下面看一下引起我们关注的12则与大数据有关的动向。其中许多来自近日在加州圣何塞召开的2016年Hadoop峰会。

Actian发布VectorH 5.0数据库

Actian首席营销官托尼·卡瓦诺(Tony Kavanaugh,图左)与Actian合作伙伴销售副总裁戴夫·休格曼(Dave Sugarman)在近期召开的2016年Hadoop峰会上交谈。

Actian本周发布了Actian Vector in Hadoop(VectorH)5.0,这是该公司现已与Apache Spark集成起来的SQL-in-Hadoop数据库的新版本。

与Spark集成起来后,就可以获取来自不同数据源、采用不同格式的数据,让开发人员得以利用VectorH,构建高性能数据流、ETL和机器学习等应用程序。随着企业组织将Hadoop分析系统迁移到生产环境,这类功能至关重要。

Actian还大肆宣传VectorH的更高性能,声称性能比像Apache Hive、Cloudera Impala、Apache Spark SQL和Apache HAWQ这些与之竞争的技术更胜一筹,并援引了TPC-H查询基准测试方面的结果。

Hortonworks经销AtScale的BI-on-Hadoop软件

AtScale开发AtScale智能平台,这让常用的业务分析工具得以访问存储在Hadoop集群里面的数据。

在Hadoop峰会上,Hadoop软件开发商Hortonworks表示,从今年第三季度开始,它将经销AtScale的软件,作为其围绕Hortonworks数据平台的套装软件解决方案的一部分。

AtScale首席执行官戴夫·马里安尼(Dave Mariani)表示,考虑到Hortonworks的市场地位,这种关系将为AtScale提供一条重要的软件销售渠道。他告诉CRN:“我们认为,这方面大有潜力带来新业务。”

Attunity发布Visibility For Hadoop系统

Attunity是一家大数据管理软件开发商,它发布了最新版本的Visibility for Hadoop系统,可帮助管理员回答诸如此类的问题:谁在访问Hadoop数据,他们在如何使用数据,以及在此过程中使用了哪些种类的IT资源。那些答案对于在基于Hadoop的数据湖生产环境里面管理数据增长和工作负载性能来说至关重要。

新版本提供了更全面的分析功能,可帮助企业组织衡量Hadoop数据和存储使用情况,用于更准确的容量规划、优化成本效益,并满足数据治理和合规要求。新功能支持Hadoop文件系统的存储级别,还支持众多Hadoop数据处理引擎,包括MapReduce、Tez、Hive和Cloudera Impala。

Dataguise DgSecure 6.0

Dataguise发布了新版本的DgSecure软件,这个软件是以数据为中心的安全平台,数据经理和首席信息安全官可以使用该平台,管理传统关系数据库和大数据平台中的敏感数据。

DgSecure 6.0与一系列广泛的数据平台和数据源兼容,并支持本地系统和云系统中的结构化数据、半结构化数据和非结构化数据。它提供了数据检测、保护和监控功能,用于数据治理。它还与一系列更广泛的IT和数据管理框架兼容。

新版本还使用内置模板和自定义模板,简化了制定数据治理策略的工作。

Hortonworks发布HDP 2.5预览版

Hortonworks将在今年第三季度发布旗舰Hortonworks数据平台软件的下一个版本,符合该公司在今年初承诺这款基于Apache Hadoop的软件遵守的“快速发布”时间表。

HDP 2.5通过分别支持Apache Ranger和Apche Atlas,增添了该系统的安全功能和治理功能。另外得到支持的还有Apache Zeppelin,这种基于Web的笔记本用于使用SQL、Scala、Python及其他开发语言,创建交互式分析文档。HDP 2.5还与最新版本的Apache Ambari集成起来,用于规划、安装和配置Hadoop系统。