流失预测模型在很多行业都有引用到切实的市场运营当中,而接下来就开门见山的说一下游戏行业有关用户流失模型的建立。
目标:关于游戏用户的流失,普片的衡量指标有周流失与月流失,接下来研究的问题有两个:
① 有关付费用户的月登陆流失问题
② 有关付费用户的月付费流失(付费用户的月登陆流失定义:本月充值的用户在下个月不再有登陆行为。付费用户的月付费流失:本月充值的用户在下个月不在有付费行为。但有可能还有登陆行为,这部分用户被称为沉默付费用户。)
数据指标理解:影响流失的普片判断有:在线活跃、充值或消费活跃、还有玩家账号一些属性(如果细分还有副本的活跃度,某些活动的活跃度,或者社交的数据等)。
本文在做流失预测模型之前做以下数据准备:
- 玩家ID
- 玩家角色名
- 等级
- 注册时间
- 本月充值总额
- 本月铜币活跃(铜币的交易次数)
- 本月绑定铜币活跃(绑定铜币交易次数)
- 本月元宝活跃(元宝交易次数)
- 本月活跃天数(登陆天数)
- 本月登陆次数
- 本月登陆总时长
- 下月充值总额
- 下月登陆天数
以上是从数据库中取出来的基本指标,而进行分析的指标可以在这个基础指标的基础上再进行丰富,例如:每活跃天在线时长=登陆总时长/活跃天数;每活跃天登陆次数=登陆次数/活跃天数;活跃度=活跃天数/本月已注册时长(大家将发现这里衍生的“活跃度”指标在后面的分析会起到神奇的效果)。数据都准备好了之后,现在就开始建立模型,以下用到的是SPSS Modeler软件。
首先采用源节点来录入数据,数据分为两份,第一份为“11月预测12月”数据,第二份为“12月预测1月”的数据。
接着利用“导出”节点导出我们所需要的衍生字段。
因为这里的“下月充值流失”是根据下月是否有充值来判断转换的,下月充值为0即为流失则标志为T,否则为F(“下月登陆流失”同理)。利用导出节点,我们依次衍生了以下字段:
- 下月充值流失
- 下月登陆流失
- 每活跃天铜币交换次数
- 每活跃天绑定铜币交易次数
- 每活跃天元宝交易次数
- 每活跃天登陆次数
- 每活跃天登陆时长
- 每活跃天充值额度
- 活跃度(登陆天数/本月已注册天数)
接下来就是对一些多余字段的过滤还有数据的清理(如包括空值的数据,或者不合理数据,如活跃度>1为不合理数据)。
添加“过滤”&“选择”节点。
把无用的字段过滤掉(根据自己源数据来过滤,如这里的下月充值(元宝)字节已经转换成“下月充值流失”字节,所以可以删除过滤掉),点击确定。
打开“选择”节点,模式选择“抛弃”,条件写上一些需要清除的数据,点击确定。