马云和小贝选谁做老公?写给非数据人的数据世界入门指南

所以就有各种数据透视分析的视角。

总结:

数据分析就是在拨弄各种数据立方体,你可以切片、切块、钻取、汇总,你所玩的魔方每一块,就是一个具体的度量值,是什么数字,则是多种维度交叉后的结果。

工作实践中,数据产品经理会考虑做出更加方便易用的“立方体玩法”以供普通用户使用:

如,在分析客户来电的自动语音导航服务中,我们就可以按不同的维度去对比看用户在导航菜单里按键量,下图所示是“按菜单对比”的界面,在“对比按”中可以进行切换其他对比视角。

至于左侧的两个筛选,也即指筛选数据集合(切片或切块了),比如限定某几个热线和菜单去看。

大数据可视化

3. 一张图片

了解了维度、度量两个词,又有了立方体之概念,让我们再来看数据是怎么产生,怎么被放到用户界面上供查询使用的。

  • 巧妇难为无米之炊。数据不是凭空产生的,当需求方提出想要什么样的数据分析的时候,首先要检视的是,TA需求中涉及到的维度是否确定被采集到?度量的计算成本是否高?比如若一个需求想要分析不同买家分层的留存,买家分层是一个新维度,需求方是按骨灰级、高级、新手等对买家进行分层。且什么叫骨灰级?系统里并未对买家进行打标记,且不同类目的骨灰级算法还不一样,加上算法定义本身也在磨合。这种情况下,我们应该和需求方一起推动业务系统完成打标,而不是自己接下这个需求,在数据仓库ETL环节完成。
  • 了解ETL:这个是做数据工作绕不开的术语,E(抽取、清洗)——T(转换)——L(装载),抽取是从各个业务系统中抽取所需的数据,然后完成语义层、逻辑层的转换,比如不同系统中记录销售渠道这个维度,有的叫做saleschannel,有的叫做channel,需要转化为同一个概念。装载,也可以理解成抽取、清洗、转换好了,装载到另外一个空间里,供多维查询服务应用调用。

大数据可视化

当然,则个领域,水很深,我只能简单描述一下,再深的也担心大家晕菜了——毕竟本文是写给非数据人的。(其实作者本人也讲不粗来了……哈哈)

四. 应用

大数据可视化

我说了,我无法教你具体复杂的数据分析案例。我希望能够借助本文和你分享下如何建立起比较专业的数据分析思路——数据产品经理本身也应该可以是优秀的数据分析师。

1. 三部曲——建立分析框架

  • 建立分析框架:了解业务、以及业务想要什么(目标)。
  • 提交数据需求: 根据你的访谈、梳理,得到业务流程、业务愿景以及目标,那么就可以和需求方共同确认“看什么”以及“怎么看”。好的数据产品经理或者数据分析师,永远不是坐等需求方提出他要看什么度量和维度,而是要引导对方看更合适的东西以回答他关于目标是否达成的问题。
  • 进行数据分析:使用多种维度,进行总体的、细分的、多维的分析,当发现问题时,能够使用这些维度的组合帮助用户找到影响原因。

大数据可视化

一切都基于你有多了解业务:

下图是几年前的老图了,左侧是业务流程图(业务流程图怎么画),右侧是概念中的数字体系示意(可视化是为了更好和需求方沟通)。

大数据可视化

PPT里因为存在具体业务的案例,不便分享,到此为止吧。如果有时间的话,我还是会编脱离具体业务的案例的……这就是写博客的苦逼之处,工作中都是工作的案例,为了写篇博客,还得自己再编一套有板有眼的故事……