LinkedIn张溪梦的分析哲学:大数据要做小做快

在很多人的印象里,职业社交网站LinkedIn是一家很另类而神秘的社交网站,但它的价值逐渐让世人侧目。在日前举办的2013 Teradata大数据峰会上, LinkedIn商业分析部总监张溪梦(Simon Zhang)在接受IT专家网记者的专访,介绍了LinkedIn如何通过对数据分析技术的利用创造企业的价值。

LinkedIn的目标,是联结世界上所有的专业人士,让他们能够更有效率,更成功。目前,LinkedIn在世界范围内的用户已增长到2亿多,86%的财富100强企业正在使用LinkedIn的付费解决方案。在LinkedIn上一季度的1.61亿美元营收中,“人才解决方案”的贡献超过了一半。

这样的成绩背后,是张溪梦以不足60人的商业分析团队,通过集成数据架构、BI、数据挖掘和分析,支持70%现有的4000名LinkedIn内部员工,涵盖了研发、产品、市场、销售和运营等五个主要商业职能部门,包括公司的三大业务分支。

有人力资源专家甚至声称,LinkedIn Recruiter付费招聘服务(LinkedIn的旗舰产品, “人才解决方案”业务的核心)是“一枚核弹”,将凭借庞大的数据库,在今后的招聘市场获得无可企及的地位。

LinkedIn如何做到这一点?张溪梦抽丝剥茧,深入介绍了LinkedIn的分析哲学及其背后的技术支撑。

LinkedIn Corp商业分析部总监张溪梦(Simon Zhang)

LinkedIn Corp商业分析部总监张溪梦(Simon Zhang)

从金字塔到菱形的分析哲学

分析工作的任务,张溪梦认为是“谋断”。李世民痛失魏征那段“以铜为镜”的名言不再赘述,在张溪梦看来,谋断就在于根据过去和现在定制未来,对象当然就是数据。

LinkedIn的三种主要的数据类别,是用户行为数据,用户身份特征数据,以及职业网络数据。如果说2亿用户的数据已经不足以让现在的存储硬件和数据库感到压力,那么相互关联的职业网络数据,绝对是当之无愧的大数据量。

“兵在乎精,不在乎多”,“兵贵速,不贵久!”古中华的兵家圭臬,是张溪梦的大数据智慧所在。他提出了两个准则,大数据要做小,做快,因为速度决定价值与成败。

数据分析的传统金字塔结构,从数据及数据质量管理,先生成商业智能和报表,再进行专门的分析,以及深度分析,最后形成商业洞察,但张溪梦表示,正如伟大的画家不会借他人之手描绘心中的美景,分析师不需要借助现成的报表来创造未来,也就是说,在LinkedIn,商业智能报表要放在分析层之上。

但改造之后的金字塔结构,仍然存在两大问题,首先是功能层之间脱节,更可怕的是,底层占用了90%的资源。张溪梦的做法,对底层“动手术”,让金字塔结构“进化”成菱形结构,当金字塔底座实现了小,整个分析流程的面积减少一半,资源的效率获得100%的提高,而很大的数据变成很小的数据,处理速度也得到质的飞跃。

LinkedIn并没有就此满足,再次把菱形做为新的金字塔“进化”,如此反复,至到不能再“小”,进入第二阶段的进化,进行球形的应用滚雪球的球形,会形成更大的价值环。

LinkedIn并没有就此满足,再次把菱形做为新的金字塔“进化”,如此反复,至到不能再“小”,进入第二阶段的进化,进行球形的应用滚雪球的球形,会形成更大的价值环。

LinkedIn张溪梦的分析哲学:大数据要做小做快

张溪梦对这套哲学的功效十分欣喜:“我刚开始加入LinkedIn,每天从早晨8:30工作到半夜两三点,一年却只不过出500个报告,支持不到200人;但现在,我的团队每人每天就能帮助别人10次。”

然而,问题来了:今天没有价值的数据,谁能保证在明天没有价值呢?信息的不对称造成的后果,很多企业都深有体会,因此,尽可能地搜集数据,是很多专家的忠告,这也是大数据之所以“大”的原因之一。

“情报永远是不够的。”张溪梦回答说,数据量在增加,也意味着存储和分析成本的增加,分析的速度的下降,随之而来的,往往是价值(ROI)在下降。

为何选择Teradata