从数据中了解用户——数据在淘宝设计中的应用

特别说明:这些选项是业务方规划产品时,根据当时具备的资源和公司内部业务划分等因素,最终确定的服务分类。
本题为多选限选,主要是为了得到最急切需要的服务排序,直接用排序题在自填的网络问卷中不易实现,选项多时用户进行排序操作也不方便。另外,如果主要目的不是排优先级,而是了解卖家急需的服务具体情况,不必限选。

36大数据

特别说明:本题是以量表题的形式呈现,实际上是“最近半年使用过哪些类别的卖家服务?”以及“使用时的满意程度”两个题目的合并。主要是因为现有的问卷系统无法实现量表题内选项的自由跳转。如果问卷系统能够实现,那么最好还是拆分成两道题目为佳。即先问“最近半年使用过哪些类别的卖家服务”,然后根据选择的卖家服务,以量表的方式询问“使用时的满意程度”。

另外,量表题的好处是能够将多个题目集中在一起提问,缩短问卷长度,节约用户的填答成本。如果不使用量表题,本题需要拆分成10个单选题目。

4.如何处理数据?

处理数据一般分为收集数据——清洗和加工数据——分析数据。

收集数据——一般而言,淘宝投放问卷的方式有以下几类:可以考虑将问卷链接做成文字链或图片链,挂在目标人群经常浏览的页面中容易关注的位置;或者在指定页面、指定时间段浮出调研链接;或者直接投放站内信、Email等,投放给指定的目标人群;再有就是使用旺旺消息,邀请指定的目标人群填答问卷等。

不同的投放方式在收集数据上会得到不同的效果(如收集足够样本的时长、完整填答率、有效率等),研究者需要根据研究的周期、投放资源排期等因素,综合选择适合的方式。

清洗和加工数据——因为从网络问卷调研中回收的数据可能掺杂了随意的答案,所以不能直接做分析,需要清洗。研究者一般会根据填答时长去掉填答过短和过长的样本;根据IP或用户名去掉重复填答的样本;根据投放名单去掉无法匹配的样本。还需要根据题目之间的逻辑关系,清洗掉填答矛盾的样本。当然还得判断是因乱填还是失误造成的矛盾,如果是失误造成的,可以保留此样本,只要对数据重新进行符合逻辑的处理就可以了,如逻辑回填或缺失处理。

接下来,研究者还需要把调研样本与后台数据进行匹配,如果发现调研样本在卖家星级、开店时长、每月成交笔数等关键变量上的分布与全网卖家总体相差太大,会使调研样本的数据结果与实际情况偏差过大。此时,就需要对调研样本进行加权处理,调整调研样本在关键变量上的分布,使之与后台数据相当,从而能够推及目标卖家群体的情况。如果关键变量的分布与全网卖家总体相差不大,可以不做加权处理。

分析数据——分析数据的方法有很多种,常用的有描述性统计、交叉分析、相关分析等,还可以能用到回归分析、因子分析、聚类分析、对应分析、方差分析等。不同方法得到的具体结果可能不同,但只要研究目的明确,得到的结论都能直接、间接地指导交互设计。

本案例中,在淘宝自有的问卷系统中录入设计好的商家服务平台调研问卷,采用站内信的方式向用户投放填答问卷的邀请,能更加直接地得到目标人群的响应,有利于快速收集调研数据。经过6天收集到5509个样本数据,经过严格清洗,最终有效样本5219个。经过描述性统计、交叉分析,得到的结论节选如下:

在商家服务平台调研问卷中,核心题目有遇到困难的方面、急需的服务、使用过的服务、使用过的服务满意度如何等,它们之间会存在逻辑关系,例如:是否因为在某方面遇到了困难而急需这类服务?是否因为没有使用过某类服务而急需这类服务?是否因为不满意使用过的某类服务而急需这类服务?是否没有使用某类服务才在这方面遇到困难的?是否使用了某类服务还在这方面遇到困难?……这些逻辑关系能够衍生出更多的变量和关系,有助于深化分析结果。

结论一、店铺装修和推广营销是卖家急需的服务类别

卖家并非满意度越低对相应服务的需求越急迫,集市卖家表现更为明显;

更多详细信息,请您微信关注“计算网”公众号: