大数据技术市场正处于这样一个阶段:Garnter认为是从IT主导的、报告系统转向业务主导、自助式服务分析的最后阶段。其结果是出现了很多新业务智能和分析平台可以满足企业机构对可访问性、敏捷性和更深入的分析洞察力的要求。
现在有很多初创公司提供这种下一代系统,他们开发新技术用于收集、管理和分析大数据,不管这些数据是结构化的还是非结构化的、动态的还是静态的、本地的还是在云中的。
下面就是2016年引起我们注意的10个很酷的大数据初创公司。
Anodot
CEO: David Drai
Anodot在2015年11月走出隐身模式,推出了实时异常检测和操作智能技术——拥有机器学习专利算法的软件,可以自动进行业务分析、查明性能问题并寻找商业机会。Anodot的目标是从大量数据中查找异常值,并将这些结果转化为有价值的业务洞察。
Anodot的技术旨在用于电子商务网站、数字广告系统和物联网网络,以提高运营效率,最大限度增加收入。
Anodot位于以色列的Ra'Anana,以及加州的桑尼维尔,在9月的B轮融资中获得了800万美元。
Confluent
CEO: Jay Kreps
在大数据管理和分析中,处理实时的流式数据是最大的挑战之一。解决这个问题的其中一项技术就是开源的Apache Kafka通讯代理项目,提供了高吞吐、低延迟的软件,用于处理实时数据。
Confluent是由Apache Kafka创始开发者创建的,提供了一个围绕Kafka的完整实时数据平台,可作为一个容错的、高度可扩展的通讯系统。该软件可用于手机来自用户活动日志、股票行情系统、设备仪表的数据,以及其他广泛用例中的数据。
今年5月,这家位于加州帕洛阿尔托的公司宣布提供Confluent Platform 3.0,通过融合Kafka Streams把流处理能力添加到应用中,还有在企业机构上下操作Kafka的Confluent Control Center。
Koverse
CEO: Jon Matsuo
Koverse开发了一款“盒中数据湖”的平台,并称它可以收集大数据并更快速地运用于生产中,其成本要低于现有的技术和方法。
这家位于西雅图的公司创建于2012年,最早的1.0版本是在两年前首次公布的。Koverse Platform 2.0是在6月发布的,将Apache Accumulo“分布式键值库”技术和该公司自己的Universal Indexing Engine结合到一起。
联合创始人Paul Brown(首席产品官)和Aaron Cordova(首席技术官)曾经是美国国家安全局的数据科学家,在那里他们帮助开发了最早的Accumulo项目,重新架构了国家安全局的数据基础架构,以更好地处理意外的数据分析情况。
Maana
CEO: Babur Ozden
Maana开发了Maana Knowledge Platform,这个数据搜索和发现软件是从大量系统或者“孤岛”中收集数据,并将其转变为可以被业务线应用采用的业务洞察。该系统是构建在Apache Spark处理引擎的。
Maana位于加州帕洛阿尔托,创建于2012年,在2015年5月正式发布,定位是收集和分析由物联网网络生成的大量数据。9月该公司首次公布了其产品的Winter '17版本,Knowledge Applications用于优化像供应链和呼叫中心管理这样的业务流程,Knowledge Assistants用于创建新的分析模型。
Maana在2016年5月进行的B轮融资中获得2600万美元,气走好难过大部分来自该公司的石油和天然气及行业客户,包括壳牌、雪佛龙、沙特阿美、英特尔和通用电气等公司。
Pachyderm
CEO: Joe Doliner
掌握着当前一代大数据技术的初创公司Pachyderm,已经开发出了一种开源分析引擎,采用Docker容器做分布式计算。
这里的重点是提供了一个容器化、模块化、可扩展的数据分析基础设施,采用像Docker和Kubernetes这样的工具作为构建块。该公司的Pachyderm File System和Pachyderm Pipeline System软件帮助数据经理和分析师构建机器学习通道和数据ETL(提取、转换和加载)工作流程。
Pachyderm创建于2014年,位于旧金山,在今年6月的种子轮融资中获得了200万美元。
StreamSets
CEO: Girish Pancha
StreamSets是另外一家解决管理动态数据挑战的公司。更具体地说,StreamSets开发的软件防止“数据漂移”的潜在问题——数据在源头的时候可能会遇到这种不可预测的突变情况,并在应用使用这些数据的时候出现问题。