大数据圈盘点:你不知道的15个新技术

MapD Technologies GPU-Powered Database

MapD Technologies推出了新的数据库和可视化分析软件,利用图形处理单元芯片帮助数据分析师交互式地探索大型数据集。

通过利用GPU的强大动力,数据库可以在每台服务器将近4000个核上并行查询,比领先的内存数据库提供更快的性能。使用带有MapD Immerse分析前端工具的数据库可以更快的处理复杂数据库的可视性问题。(例如政治捐款,在此地图上就可以看到数据)。

MemSQL 5

MemSQL开发了其同名的数据库,用于事务处理和实时分析。在该公司公布的最新版本MemSQL 5中,提供了一系列的新技术和增强的功能,以提高软件的数据库、数据仓库和流媒体的工作负载性能。

在新版本中,通过混合的事务处理或者分析处理将事务和分析合并成一个单一的数据库,以支持OLTP和OLAP查询。用户可以在大量的写入负载中实现实时查询。借助于可插拔的认证模块以及类似于Kerberos的工具提高了安全性。用户可以通过使用MemSQL Streamliner来部署Apache Spark,创建了用户可视化界面的实时数据管道,同时消除了批量的ETL任务。

Paxata Spring '16 Release

Paxata的自适应数据准备平台,建立在Apache Spark之上,运行在最优化的Hadoop环境中,提供了数据集成、数据质量、语义丰富、协作和管理能力。

新版本提高了软件的能力,通过先进filtergrams综合数据分析,跨越列宽数据集的细粒度搜索,对于数据发现与统计选项的新的选择,以及在Hadoop压缩文件下集成复杂的嵌套JSON/XML数据,为用户提供了连接信息的能力。

该版本还包括新的IT控制,以提高系统的管理、安全性和规模。

Platfora Big Data Discovery 5.2

Platfora是一个很大的数据发现平台,建立本地的Apache Hadoop 和Spark。最新的版本"democratizes(民主化)"大数据,使其更容易使用现有的商业智能工具来访问Hadoop数据。

新版本提供了本地Tableau直接出口,用以准备和丰富数据集成的Tableau (画面数据提取)数据到Tableau桌面和Tableau服务器中。其他前端BI工具可以通过lens-accelerated SQL访问Platfora数据,通过SparkSQL和ODBC处理查询。

Platfora5.2也直接运行在Hadoop集群上,除了传统的专用配置外,可以助其更容易地利用现有的硬件,并重新调整计算资源。用于数据可视化的Platfora Vizboard已经得到增强,能够"更加智能化"的默认可视化效果。

Ryft One Cluster

Ryft系统开发的硬件/软件设备,使用FPGA的并行处理能力处理器加速了tb和pb级别的数据分析能力。

新版的Ryft One Cluster使用带有开放API接口的混合FPGA / x86计算架构,该公司表示,这可以实现以100倍的速度加速大数据生态系统的发展,同时降低70%的成本。

新系统扩展了数据分析性能和存储线性,处理分析速度达到每秒200GB以上。它可以作为一个独立的群集或作为现有的Apache Spark系统或其他大数据生态系统的一部分工作。

Tableau 9.3

Tableau公布了Tableau 9.3全面上市,在最新的版本中,其最受欢迎的数据可视化软件可以永久地连接桌面功能和Snowflake Elastic Data数据仓库。

Tableau Desktop 的"一直连接"功能可以更容易的与他人分享结果,同时留存在流动的分析过程中。该软件的全球地图覆盖功能获得了显著地提升,新数据添加到了地址解析数据库和Tableau Map Service中。

在9.3版本中,本地连接到本机连接到Snowflake Computing的云数据仓库系统更易于Tableau用户执行简单和复杂数据探索和分析。这两家公司还将继续合作,帮助客户将他们的业务分析过程转移到云端。

Talena ActiveRx

Telena的软件是用于在测试和开发、备份和恢复、归档和法规遵从和灾难恢复系统中优化数据。

Talena最近推出了ActiveRx,是一款新的预测分析软件,它采用机器学习算法和数据可视化,以更好地管理大数据的管理工作负载,和更准确地预测数据的可用性。

ActiveX软件还提供了"驱动副本分析"功能,企业可以用它来把闲置的备份数据转换成有用的资产。

Tamr Apache Spark Compatibility

Tamr的数据统一平台拥有丰富的企业的数据 ,汇聚了从企业内部和外部的数百甚至数千数据源进行分析。

Tamr宣布其软件可与Apache Spark兼容,其内存处理引擎可用于扩展机器学习,Tamr表示,其补充了机器驱动方式以备企业数据之需。

Tamr也在开发开放的接口和核心组件来支持由Spark驱动的数据监护系统。