作者: Andrew Nusca,Robert Hackett,Shalene Gupta
译者:朴成奎
摘自:财富中文网
大数据不只是要处理很多的数字,还得要通过这些数字建立模型、深入挖掘,并且寻找那些有可能改变企业运营方式的信息。以下谨为大家介绍20位大数据领域的顶尖人才。
Pinterest数据科学家安德莉亚·伯班克
Pinterest是一家以图片为主的社交网络,数据科学家安德莉亚?伯班克主要负责该公司的A/B测试,评估公司网站、APP的外观或功能变化会对它的6000万全球用户产生哪些影响。如果Pinterest网站上的某个小模块让你想邀请朋友也来玩一玩,或是某一封它发来的推荐邮件让你关注了更多话题,那么这很可能就是伯班克团队的那只“看不见的手”起了作用。她在今年三月的一次行业会议上表示:“为了今后能为几十亿用户提供服务,我们已经针对几百万用户做了数百次试验。”试验还拓展到了Pinterest自身的运营上。伯班克最大的成就之一,就是给Pinterest的其他员工赋权,让他们也能开展试验。她表示:“以前只有一个故障点,但也只有一个知识点,现在不同了。”——Andrew Nusca
0xdata公司物理学家、黑客阿诺·康代尔
阿诺·康代尔从小就生长在一个科研氛围浓厚的环境中。他出生于瑞士一个叫做下锡根塔尔的小村子,这个村子恰好位于拥有欧洲顶级粒子加速实验室的保罗谢尔学院(Paul Scherrer Institute)和欧洲大陆最著名的科技院校苏黎士联邦理工学院(ETH Zürich)之间。在学习粒子物理学和超级计算机学期间,康代尔曾经在电脑上建立过宇宙的模型。后来他搬到美国加利福尼亚州,在斯坦福大学直线加速器中心的全国加速实验室中工作(SLAC National Accelerator Laboratory),后来又开始创业,成为Skytree公司的创始工程师,并且设计了几套高性能的机器学习算法。现在他是Oxdata公司h2o数据分析平台的核心开发者,他开发的这个h2o平台,被编程社区GitHub的成员誉为最优秀的开源Java机器学习项目,而且它还可以兼容流行的统计编程语言——R语言。他在Oxdata公司的头衔是“物理学家兼黑客”。——Robert Hackett
Hortonworks联合创始人阿兰·默西
阿兰·默西最早在雅虎公司(Yahoo)工作,现在已然用途极广的开源存储和处理软件Hadoop在那时尚处于早期原型阶段。默西的团队的任务就是扩展Hadoop的功能,让它用于雅虎的网页搜索。于是默西研发了一个名叫YARN的资源负载管理系统,它的作用大致相当于Hadoop的一个操作系统。默西表示:“第一版的Hadoop看起来就像还在用Notepad的Windows,但是我们真正想要的是能用Powerpoint、Word和Excel的Windows。”这正是YARN的魅力所在:它允许用户向Hadoop中插入多种应用以存储各类信息。默西表示:“我家里有两个孩子,但YARN就像是我的第三个孩子。”——Robert Hackett
NuoDB首席执行官巴里·莫里斯
很多科技公司都想发起一场技术革命,但是很少能获得上一波技术革命领导者的支持。马萨诸塞州剑桥市的NuoDB公司却一举网罗了上一波数据库革命“四大天王”的其中之三——Ingres公司前CEO加理?摩根泰勒、Sybase公司前CEO米切尔?克兹曼、Informix公司前CEO罗杰·斯普尔。只有最后一名“天王”,也就是甲骨文(Oracle)的CEO弃权了,但他也身在投资人之列。这么一家名不见经传的公司何以有这么大的号召力?因为NuoDB的技术解决了一个多年来被行业视为“圣杯”的问题:如何让一个数据库在多个服务器上运行。“关键在于用更多的机器,而不是更大的机器。”该公司CEO巴里?莫里斯表示:“那个问题听起来虽然简单,但一直没得到解决。”DuoDB公司成立于2010年,现在这家公司已经签下了一个大客户——欧洲第二大软件厂商达索系统公司(Dassault Systèmes)。另外莫里斯认为,公司正在飞速朝着一个“新的聚焦点”迈进。他认为DuoDB将走上舞台的中央。“它的意义不在于数据的规模或运行速度,而在于形成一种数据导向型模式。持续改进的能力才是它的革命性所在。”——Andrew Nusca