从 2012 年到 2015 年,大数据持续发威,IDC 市场调查机构预测 2017 年大数据市场将价值 324 亿,拥有这样“Big Data、Big Deal”远见的人,正在利用大数据激荡出最有创意的构想,用数据的力量来创造出大量的价值。从让资料搜寻分析平台,到利用大数据帮助癌症治疗,大数据新创公司这几年内如雨后春笋般出现,2015 年这些“Big Data Startups”也会持续挖掘大数据的价值、微调其企业策略,期盼在市场中展露头角。以下几家新创公司都已经各自获得好几轮金额可观的融资,在大数据市场中十分有潜力,值得我们关注并参考,从中瞭解大数据的应用方向及潜能。
SumAll
SumAll 是一家位于纽约的新创公司,成立于 2011 年,主要为中小型企业提供即时数据分析服务。SumAll 的线上分析平台收集社交媒体及电子商务上的数据,并进行分析后,把可视化的分析结果展示在互动介面上供企业客户参考。例如社交页面上的网页流量、ebay 上的销售量等数据,生成每星期、每个月的分析报导,让企业客户追踪且分析使用者/消费者。
这家公司还有一个很酷的地方:他们分了百分之十的股份给旗下的 SumAll.org —— 一家旨在用资料分析增加社会福利的非盈利组织。
Luminoso
Luminoso 成立于 2010 年,原本是麻省理工大学媒体实验室的一个研究项目,后来发展成利用人工智慧进行文本分析的新创公司。从通讯工具里的讯息、网络上的评论等数据来源,利用自然语言处理和机器学习技术,帮助企业分析消费者在各种通讯渠道中讨论的话题。
举例来说,Luminoso 提供的服务可以帮助企业追踪时下发生的热门讨论,还可以根据需求迅速回应,如果消费者对于某产品的缺陷在网上进行了投诉或者抱怨,企业可以及时进行补救。
Flatiron Health
同样发源于纽约的 Flatiron Health 成立于 2012 年,是大数据应用界中是十分有名的“医疗大数据技术”新创公司,主要专注于癌症数据分析1。
Flatiron Health 透过各种管道收集病患的临床纪录、医师诊断纪录、患者治疗结果、基因数据及缴费纪录等数据,透过分析整合后提交给肿瘤学家,透过分析过往的治疗方法跟纪录,帮助医生做出更好的临床诊断跟医治手段。全美现在有约 1000 名肿瘤学家在使用 Flatiron Health 的数据。
Flatiron 的分析平台 border="1" width="600" alt="大数据" height="686" />
Tamr
Tamr 成立于 2013 年,其技术来自于麻省理工的电脑与人工智慧实验室,由麻省理工学院教授兼数据专家 Michael Stonebraker 跟种子投资家 Andy Palmer 共同创办,在 2014 年正式营运。
大数据的其中一个问题就是资料量太大了,而且资料来源剧增又不断变换,Tamr 的机器学习演算法跟软件能有效而大规模地广泛整合和管理现有和未来的多种数据来源,大量降低数据来源的搜集与连结所用的时间,同时辨别资料来源及之间的关联。
Alpine Data Labs
Alpine Data Labs 成立于 2010 年,总部位于旧金山,算是十分有名的大数据分析挖掘软件新创公司,该公司总裁兼首席执行长 Joe Otto 和首席产品长 Steven Hillion 都来自于被云端储存服务提供商 EMC 收购的 Greenplum 公司。
大部份的大数据新创公司都在做“资料可视化(Data Visualization)”,Alpine 则是提供大数据及 Hadoop 的预测性分析功能,且号称是全球第一个针对大数据的团队合作分析解决方案。
DataStax
DataStax 成立于 2010 年,总部位于加州,在去年 9 月曾获得惊人的 1 亿 600 万美元 E 轮融资。
DataStax 主要业务是开发和销售开源分布式数据库 Apache Cassandra 的商业化版本。Apache Cassandra 是高扩展性、高容错的 NoSQL 数据库,比传统的关系式数据库多了许多优势,其设计不仅兼顾了扩展性和开发灵活性,而且搜寻效率也相当不错,特别适合大数据的储存,像是 Cisco、eBay 等大公司都在使用这种数据库。