别白瞎了,正宗的大数据思维就在这里!

不仅要看图,文字还有真干货。

上面是100+手机的最新网图,它正在网络中四散传播,当你打开“郝闻郝看”的这几秒,它已经在互联网被传递和转载了N次,这就是力量,让信息不断扩张与自我延伸,同时也造就出更多数据。

按照阿里巴巴副总裁、数据委员会会长车品觉的话说,这是社交数据的常态,它决定着时代大潮下数据分析的特征——冷艳高贵接地气,奔放洋气有深度。

要知道,Windows95时代的数据分析,MB量级;Google搜索时代的数据分析,GB级;而到了社交时代,数据分析就是TB级,每每千倍数量级的增长,到如今,自然变成了“大”数据的分析,大在数据的数量级,也大在数据的多样维度,此外,更讲求Veracity(真实性)、Velocity(及时的速度),进而,大数据分析才能真的“可实施”、“可解释”与“数据准确、稳定”。

概念多多吧?很抽象!不好意思,小郝子只能告诉郝友们,这些概念是大数据思维的基础,没有它们,谈什么大数据都是无本之木,无源之水。这是小郝子第二次听品觉老师布道,在上海“福布斯”的论坛上。与去年末采访不同,这次多了一些业内资深者的探讨,思想的碰撞,展现出大数据思维在实践中的火花。

一、问题既是答案,你懂么?

问题就是答案?是的,大数据思维就是要会“问”。

品觉说了个案例——之前,南方电网有人请教,他们收集每户各时段用电的数据有用么?品觉考虑了一下,问对方,能否用不同的时段的用电量数据,来估算大件家用电器是否出现故障,电网的人回答说可以,那么这样就可以衍生出针对的服务,提醒屋主“电器可能出现故障”,早些维修,避免出现短路、火灾等隐患。而更进一步,若能了解其家用电器的品牌、型号,更可以告诉商家,相关产品的地理分布,实际故障率等等数据,这些对它们生产、销售又具有极大的意义……这不就是大数据思维了么?

点融网创始人郭宇航则分享了第一个案例,他曾到著名的P2P网贷同行Lending Club去学习,早年,Lending Club一直在收集一些看似无用的数据:比如,用户上网的时点,填写借贷申请表花费的时间,但后来,时间久了,Lending Club发现这些统计都与借款者的违约率密切相关——总是在大半夜上网寻求贷款的人,他们很可能没有十分稳定的工作;而很快填写完借贷申请表的人,很可能借贷的态度不是那么谨慎,其动机就值得深究……看似没用的数据最后却可以展现极大的能量。

所以说,看到数据不是重要的,关键是怎么将它们应用于展现其价值的地方,让老板更了解商业运营的各个切面,让风控更多控制风险的角度,让跑步的人更懂得自己身体各部位的状态……那么,大数据就是为你而生。

二、假设与答案之间

又是段子两则:

如若京东创始人刘强东向你要“周报”,你要做一份什么样的周报?告诉他:“以西红柿为代表的生鲜做得很好”,或者是:“奶茶事业大有可为”?都不对,你应该以周为单位,回顾之前刘布置的任务要点,哪里做得好,为什么好,哪里有问题,为什么出现这样的问题,有哪些解决方案,最好的解决方案是什么,为什么;当下的电商环境出现了哪些重要的变化,京东需要做怎样的适应性变化……没有准确假设的大数据分析,即便拿出结果,也不能说服刘强东这样的大佬,因为一开始方向就错了,假设差之毫厘,结果谬以千里。用大数据来讨好领导?当心马屁拍到马蹄上。

另有一位互联网企业高管说,阿里投资优酷,第二天股票一定跌,“这就是我的大数据。”没错,第二天优酷的股票跌了,但这就大数据了?真心扯淡,不涨就跌,也就是50%的概率必定猜对。大数据分析可不是一次猜中就行,要次次“猜中”才是真的大数据分析,更核心的,要“猜到”——涨,涨多少个基点;跌,跌多少个基点。不然,比巫蛊卜算还不靠谱,怎么能是大数据?小郝子个人觉得,不懂装懂,正是这群人污秽了大数据的美好愿景,就是“劣币驱逐良币”的变种,SB兮兮。(请原谅小郝子又骂人了)

可见,不懂假设就找不到答案,蒙对了答案也不能证明大数据思维,在一套严谨的数学体系下,大胆假设,小心验证,调整,对标,才是寻求大数据正解的良途,虽然它注定不会平坦。