这是笔者在这新博客上的第一篇文章,对于第一篇文章,我纠结了半天,不知道写什么最好。或许是怕所写的内容对读者没有帮助,亦或是老生常谈大家看腻了的东西。
思考良久,终于决定写下这篇您正看到的文章,关于分析用户偏好的一些分享。之所以写这个内容,一方面是因为这个主题在国内的网站分析相关的博客上能找到的文章不多,另一方面,我所介绍的方法有较大的应用空间,或许可以给大家带来一些启发。
用户偏好分析是一个比较大的题目,哪怕只是将它局限在网站分析领域中,也可以从各种角度入手来了解你的网站用户。限于篇幅和笔者本身的能力,这里将介绍的是笔者认为比较实用的,也认为是容易上手和扩展的方法,也同时希望能够起到抛砖引玉的效果。
【正文】
熟悉网站分析的朋友们都知道,GA(Google Analytics)中可以关联不同的维度(Dimension),比如“城市”和“产品”,通过关联(Sub-relation),我们可以得到不同城市下,各产品的相关数据。在Omniture的几个网站分析工具中,也同样能够对某个eVar根据按另一个eVar来breakdown。
好了,废话不多说,接下来就让我们一起去发现一些有趣的事情!
Step 1. 获取数据
1.a 请生成一张报表,
维度(Dimension):城市(Cities)
指标(Metric):购买数量/销量(Units)
时间段可根据需要设定,时间粒度(Granularity)在Omniture中选None/aggregate,表示把时间以聚合的方式展现,而不是按daily、monthly等方式来划分,GA中同理。
好了,我们得到了一张关于各个城市的访客所产生的订单数的报告,第三列Ratio是经过计算得到的各城市订单数占总体的比例。这里假定了只有图表中所列出的10个城市,所有数据均为模拟数据。
1.b 类似上一张城市报告,我们再获得一份产品类(Product Category)的报告,维度:Category, 指标:Units,获得的报告如下
* 这里需要注意,你所看到的两张表中的Units总量是一样的,但如果你选择了Orders作为Metric的话,那么品类报告中的Orders应该会大一些,因为有些用户的单个订单横跨了不同的产品类。比如实际情况是你下了一个订单,包含了一台VAIO和一台DSC,那么在产品类报告中这1个订单会被分拆为2个,各自归属到2个品类中。如果Orders总量相差不大,那不用太在意这个差异,如果你觉得差异让你无法接受的话,那也不难,对城市报告中的数据做个简单处理:处理后各城市订单数 = 处理前各城市订单数 * (产品类报告订单总数 / 处理前城市订单总数)。但是这样的处理会稍许影响到后续介绍的计算过程,当然,只要你保持头脑清醒,相信在理解了算法后根据需要来修改也不是难事。
1.c 获得一份Sub-relation的报告,第一个维度选择城市,第二个维度选产品类,指标仍然是Units,报表如下:
City Breakdown by Category
限于篇幅,图中只显示了Shanghai的数据,实际应该是所有其它城市都会得到跟Shanghai类似结构的数据。由于本例中共有10个城市和10个产品类,因此得到的数据应该是10*10=100行。同样,这里的Units总量应该与之前的相同。
从表中我们可以知道,在Shanghai所产生的962个Units中,VAIO占了378个,DSC占了112个,这个很容易理解。
Step 2. 数据处理
Difference
如上图所示,我们在1.c报表的基础上,新增一列Predicted Units,作为我们预测的商品销量,怎么计算呢?Predicted Units = 1.a中Shanghai的 Units * 1.b中VAIO的Ratio(或者1.a中Shanghai 的 Ratio * 1.b中VAIO的Units也是一样的)
然后我们再新增一列Difference,表示实际值与预测值的差异程度,计算方式为:
更多详细信息,请您微信关注“计算网”公众号: