马云和小贝选谁做老公?写给非数据人的数据世界入门指南

三. 欢迎进入数据的世界

大数据可视化

还记得你学习游泳的经历吗?记得我当时就是怎么都不敢下水。

我的教练告诉我的最有用的一句话是:你会憋气吧?你试试在浅水区里什么都不要做,松开栏杆,憋住气,让自己沉下去。如果你受不了了,反正你一站就站起来了。

我一想,也对,反正浅水区嘛。于是第一次松开了栏杆。

奇怪的事情发生了。我居然不会沉入水底耶~甚至透过泳镜看别人的脚扑腾扑腾!原来水里的世界没有那么的可怕!

克服了这个对水的恐惧后,才开始慢慢学习各种动作,开始享受水的乐趣。

数据的世界对于不了解它的人而言,正如这神秘的水一样。

那么我提供的让你不怕“水”的心得有:两个词、一个立方体、一张流程图

你准备好了吗?

1. 两个词

先复习一下你可能也听过的两句话:

  • 如果你无法量化,那就无法很好管理。
  • 无细分,不分析。

第一句话来自管理大师彼得德鲁克,第二句话则是分析界的金玉良言了。

这两句话里就隐含着我说的这两个词。

接下来,再来看一句话:成交10亿人民币!

肯定没有人单独说这样的话,一般情况,这句话前都要加上一些“定语”,比如“今年截至到7月份,全国蔬菜市场”,或“去年9月,女装市场”,或“过去N年,东三省猪肉市场”……等等。

这些语境里,也隐含着这两个词。

再来看一张图:

大数据可视化

这是刚入门时,为了追求PPT的好看,做的一张概念图。虽然当时还没有体会到两个词的重要,但是从感觉上,我画了以上的图,有位前辈说,维度还不够。

哦,我后来才知道,中间的圈里,我大部分呈现的是度量,而下面的几个圈,我列了重要的一些维度。至于上面的几个圈里,应该是呈现的分析专题或功能。

至于你平时有机会接触到的各种数据可视化,报表,也基本上脱离不了这两个词,比如,若你去客服部门分析客户来电量(下图仅供演示,非真实场景数据)

1. 你按时间趋势来看总体来电量。当你发现某个月或某周来电量波动较大,你就需要添加别的“角度”来进一步细分。

2. 你按热线来细分来电量,看看来电拨打的什么热线。

3. 当你发现某个热线来电量波动异常后,你又需要进一步细分,看看此热线的来电是被什么接起公司承接的……

大数据可视化

下面不卖关子了。有些人可能已经猜到了,我要分享的这两个词就是:维度+度量。

下图中,我将重点放到大道至简几个字,以及维度+度量上,而维度和度量下面分别放了所在家族的一些其他常用词汇,我稍后会解释。

大数据可视化
我始终认为在这条路上,我有一个两词之师,当我比较迷茫的时候,他就像当时教我游泳的导师一样,告诉我:你不需要了解那么多,只要了解数据的世界没有那么复杂,知道有什么维度,看什么度量,然后怎么呈现出来即可。

对,他没有时间教我别的,也没有分享过任何文档给我,只告诉了我这句话,但是让我受益至今,因为那一刻,就是恍然大悟。所以我现在也分享给你们。

定义:

1. 度量:即Metrics, 指量化的数值。一般都有个名称,比如网页浏览次数,网页浏览时长,支付宝成交金额等等。平时,我们一般会叫成“指标”,但是在专业语境,你需要知道,指标和度量还是有些差异,比如某些场合,他们会用指标特指一些经过计算的度量结果,比如拿度量A(网站总浏览次数),除以度量B(网站总浏览人数),得到一个新的指标(网站人均浏览次数),用以衡量网站粘性。但是我建议你平时使用两者可以通用。