从《古惑仔》里看流氓的数据陷阱

五、我不是教你诈之图表陷阱     

  做一份数据报告,没有几个折线图条形图,都不好意思说自己是研究数据的。但是每一份高大上的图表背后,也会隐藏着不少的小秘密。    在上图中,所有眼睛没问题的人都能看出铜锣湾扛把子陈浩南从《古惑仔》第三部开始,他参与群殴的次数和单挑的次数都急剧下滑,一直到2000年,他都不打架了!如果有心人刻意地加一句解释“《古惑仔》第四部上映的时间是1997年”。那么估计很多不靠谱的数据分析家就要开始说“从陈浩南出手次数可以看出香港回归之后社会治安好转”“黑社会社团在97之后转型民营企业,金融战取代街头混混砍杀”“驻港部队让香港居民安全感倍升”……       实际上呢?实际上是《古惑仔》第四部战无不胜,里面冲锋在第一线的是和生番抢屯门的山鸡,陈浩南主要时间都在泡李嘉欣。而2000年版,名字则是《友情岁月之山鸡故事》,本身陈浩南在这里面就没有什么戏份。   同样的,在不少公关软文中,会让人惊讶地发现自己企业和对手企业的走势图的比例尺都不一样,最终会显得自己企业的曲线是那么高耸入云,而对手的走势是那么的飞机场。       六、把数据放在什么位置       东星五虎之奔雷虎,会在自己一个古惑仔的酒吧里放莫扎特的安魂曲,但是这悠扬的乐曲中,耀扬不会因为自己对莫扎特的喜爱就放弃摔死恐龙。       韦小宝将阿珂视为心目中的女神,但是他不会因为自己对女神的膜拜就放弃在丽春院的大床上为阿珂宽衣解带。       同样对于数据分析来说,应该对数据进行基于经验的理解和科学的计算,然后表达并传播出来,让其有利于下一步决策。如今的很多数据分析集中在了计算和表达上,但是忽视了下一步的决策。       无法对工作决策形成决定作用的数据分析,连花瓶都算不上。       要知道单凭数据,有时并不能改变现状,因为大家可能不相信你的话或者数据,在19世纪匈牙利医生塞麦尔韦斯通过大量的试验得出了结论“是医生未经消毒的双手才导致了产妇因为产褥热而死”,但是这结果一出,导致了医学权威纷纷跳出来指责他,他从而伤心地离开了维也纳。直到他去世的1865年,巴斯德的细菌理论才问世,所有人才正视塞麦尔韦斯当年的数据。       所以,在做任何数据分析之前,请先想清楚自己为什么要做这个分析,以及期望为哪方面的工作得到决策帮助。   七、尾声   其实本文非常适合起个名字叫做《如何用数据欺骗自己的老板》,如果你是打工仔,那么本文只是粗略地普及基本知识,更多的数据统计陷阱需要你在工作生活中不断地去发掘和完善,相信有一天,你会被老板钉在公司的耻辱柱上的。   如果你是老板……您看这种文章不怕影响到自己未来的上市计划吗?       当然,最后送给诸位一句古惑仔里的经典台词,   “出来混,错了要认,被打也要站稳!”   作者微信公众号:kuaidaoqingyi520 文中图片版权归 @王新宇   作者注:在12月22日虎嗅年底FM大会上的六分钟演讲实录整理版。让人感动的是当问起都有谁看过《古惑仔》,下面那些高大上的文艺青年们都纷纷举起了手,谢谢,让我看到了流氓事业的薪火不断。