首先,在纸上用相互垂直的直线画出许多小方格。然后,在横轴的底部注明月份,在纵轴旁由下往上地标上数字“0,2,4……”并注明数字的单位“十亿美元”。在图中点出每个月的国民收入,再用直线将这些点连接起来,你将获得类似下面的图形。 这个图清楚地显示了一年来的变化,而且变化是逐月反映出来的。然而,画图者很快就会发现,由于图形的纵轴从“0”开始,并且整个图形都是按照比例绘制的,虽然直线的确上升了10%~一个了不起的上涨趋势,但视觉效果却并不振奋人心。
既然已经开始行骗,那么就别急着金盆洗手。你还有比之更好的方法,它能将朴实的10%变得比100%的增长率更令人欢欣鼓舞。只需要稍微改变横轴与纵轴刻度的比例关系,将纵轴的每一个刻度缩减为原来的l/10即可。没有人规定不能这样做,而这会产生一条更完美的折线——绝对的视觉冲击。
令人震惊!不是吗?任何看到这幅图的人都会强烈地感觉到在国家的各条经济命脉上正快速地积累大量的财富。这相当于将“国民收入增长了10个百分点”改写成“国民收人惊人地攀升了10个百分点”。显然,图形比文字更有效,因为它不存在任何形容词和副词来破坏图形的客观性所形成的幻觉,而且谁也无法指责你。
又假设数据的波动性很大,比如说如下10, 1, 20, 3, 30, 4, 50,看起来应该是:
完了,公司的财务状况这么不稳定!!!怎么办!没关系——如果我只抽取奇数项的话(挑取x轴,虽然挑得好像是很有系统地——奇数,但是你总能想到一个看着挑得系统的方法),就会看着像:
明年又可以上市了。。。。。
有时候我们需要通过一些好看的图形对外证明业绩,但别忘了,好看仅仅是好看。
Part 8:相关的误解
科学家从几万人胳膊长度和治理测试的统计数据中,发现人的智力水平个胳膊长度是正相关的:胳膊长的人,智力一般也较高。
很多事物表现出相关性,之间却不存在因果关系,两个事情的关联关系并不能说明其中一个变化能引起另一个的变化。关联却无因果很可能是他们同受第三方因素的影响,上述数据的统计范围从不足1岁的孩子到完全成长的成年人,在人成长中,体型会逐渐变大,智力会发展,实际上,两者都是随着年龄变量进行变化,从而变现出相关性。
一张图来说明:
Part 9:无意的精确
同许多受教育的孩子一样,小王和小红接受了智力测试,小王的智商是101,小红只有98。当然你很清楚:智商的平均数是100,即100意味着“正常”。 哈.小王是比较聪明的孩子,而且他的智商高于平均水平,小红则低于平均水平。对此我们先不详细评论。任何类似的结论纯粹都是胡说。与其他抽样的结果一样,代表智力水平的数据也具有统计误差,这个误差将用来衡量该数据的准确度和可信度。然而人们有时会为了一个数学上可论证却小得没有意义的差别费尽力气。这种行为是对这句古训的藐视:只有当差别有意义时才能称之为差别。
当前差1-2分落榜的现象比比皆是,的确是统计学的悲哀。
Part 10:逻辑的悖论
如果我告诉你,当你每天“以每小时70英里的速度疾驶在高速公路上”,如果时间是早上7点,那么你生还的机会将是晚上7点的4倍。证据是,“晚上7点发生的灾难是早上7点的4倍”。但根据这样的证据是否能得到上述的结论?晚上的车祸比早上多,仅仅因为晚上有更多的车和人在高速公路上。单独一个驾驶员在晚上也许会比较危险,但上述的数据却不足以证明这一点。
以同样荒谬的逻辑继续推理下去的话,你还可以证明天气晴朗时驾车比有雾时更危险。因为晴天比雾天多,所以天气晴朗时会有更多的交通意外。但只要运用常识,你我都能知道雾会使驾车变得危险。