有了这7家大数据工具企业,还需要数据科学家么?

正如福特公司大数据主管John Ginder和其他一些企业的高管所描述的一样,业内缺乏简单的工具来解决大数据问题。

 

“我们正在走向大数据这一伟大的终点。”John Ginder在接受媒体采访时说,“尽管福特有专家来研发工具以及针对一些特殊应用的具体问题进行开发,但是面对未来所有数据都将被挖掘的现状,我们没有足够的人手和工具。数据专家而不是计算机科学家,要对数据进行审查并发觉之前没有被挖掘出的关系。这显然是一个很美好的未来,但可惜的是现在我们还没有这样的能力。”

 

美国7家大数据工具企业(产品大多测试阶段)

换句话说,运行Hadoop集群或执行分析需要具有特殊技能的专业人员。但如果想进行大数据革命,最先面临的挑战就是如何像当年网景(Netscape)简化上网体验一样简化大数据处理。美国已经有7家创新企业正在从事这一工作,这些企业的独特产品会帮助你抛弃你的“数据科学家”。

 

Datahero:关于可视化的创新型企业。可以将数据变成漂亮的图片,进而帮助客户或者其他人更好地认识和理解数据,以带来新的合作。用户可以将他们的数据文件直接交给Datahero来做。

Prior Knowledge:相对较新,2011年8月成立,是麻省理工学院毕业生所创立的。其核心是让非数据科学家玩转数据。其提供的服务可以让人们上传数据并与Prior Knowledge的数据库API相关联,从而提供相关性信息评估,并帮助应用开发者建立预测模型。其已经获得来自创始人基金和天使投资的14000000美元的资金。

P(K)的数据库做幕后的数学分组的视觉例子

Platfora:在Hadoop,每个人都喜欢大数据批处理平台,但其并不那么容易使用。Platfora的目的是通过一个拥有先进数据科学功能而非查询功能的直观的用户界面帮助你处理大数据。已经募集57000000美元,预计明年推出产品。

 

ClearStory:响当当的一家创新企业,提供与软件相抗衡的服务。Google、 Andreeseen Horowitz和Khosla都有投资。其目的将各类来源的数据(也包含Hadoop)汇总到一个地方,在那里,客户可以通过GUI来交互和可视化数据。

Karamasphere:karmasphere产品的目的是在工作量和应用甚至桌面上,减少开发过程。其可以让用户编写类似于SQL查询语句时可以连接到他们最喜爱的智能工具和分析软件,并进行相关分析。

Datameer:与其他企业相同,Datameer也是希望可以使化Hadoop应用更简便。其通过创造一个更为用户所熟悉的可覆盖的电子表格,企业可以利用这个表格来分析Hadoop的工作,创建可视化以及绘制关系。其比较接近Karamasphere,但也有新功能,比如允许某人在一台机器上运行多个分区。

 

BigML:就像Prior Knowledge,BigML是一家将数据与机器相结合以帮助使用者获得解决他们是数据问题的方法的初创企业。BigML希望使用者通过以下四个步骤实现:建立一个数据源,创建一个数据集,建立模型以及生成预测。其在private-beta模式上实现。

BigML的数图文件处理