当前位置: 首页 > 方法工具 > 正文

生存分析Cox模型在用户生命周期分析中的简单应用

说明:本文章适合对生存分析及Cox有一定了解和基础的读者,对于无基础的读者请先阅读文章《生存分析简介》或其他统计学书籍补充这方面的知识。

一、分析目的

1、分析目的:了解用户从注册到流失生命周期中随时间的变化情况,以便在关键时期对用户采取挽留措施。

2、样本:特定时间内新注册用户数据(N=49804),数据结构如图所示:

数据结构-1

字段说明:

用户标识:用户身份识别标识,为保护隐私,文章已经做了马赛克处理。

用户来源:用注册时使用的平台,包括wap和app。

流失时间:用户从那一周开始流失的。

是否沉默:用户是否出现过流失现象。说明:流失指用户连续4周未访问过。

是否回访:流失用户是否再次来访问过。

回访流失周差:流失的用户从流失开始第几周再次来访问的。

具体数据

3、分析工具:SPSS

二、分析过程

1、选择菜单操作“分析(Analyze)→生存函数(Survival)→Cox回归(Cox Regression)”打开弹出界面。在界面中进行如下选择:

COX回归分析01

定义事件:因为本次分析关心的是“流失行为”,所以要选择值“T”。如下所示:

COX回归分析_定义事件

点击“绘图”选项卡,勾选“生存函数”和“危险函数”,如下图:

COX回归分析_绘图

点击“保存”选项卡,勾选“函数”、“危险函数”、“X*Beta”选项,这样可以在原始数据中生成相应的数据值。如下图:COX回归分析_保存

点击“确定”对数据进行分析,结果如下:

COX回归分析_结果01

上图为样本基本信息描述,下图为累积生存函数图,此图为本次分析的目标图表。

COX回归分析_结果02

从图表中可以看到,用户从注册开始的下一周就出出现大量的流失,流失占比达到了65%以上,在注册后一个月内有80%以上的用户会流失掉,因此对用户采取挽留措施最好的时机应该在用户注册后的一周,最迟不能超过注册后的一个月。

由于本次分析的用户有wap和app两种不同的来源,这两种来源是否存在不同呢?

为了对这个问题进行分析,需要在cox分析中进行分层,操作与上面的基本一致,不同之处如下图:

COX回归分析_分层

运行分析程序后结果如下:

COX回归分析_结果03

 

从结果可以看出来自app的用户流失率低于wap用户,但流失曲线走势基本一致。

结论如下:app新注册的用户流失程度低于wap用户,在用户注册后第二周需要对用户采取一定挽留措施,以防止用户大量流失。

建议:略

三、补充说明

1、上面的分析只是利用Cox分析模型生成了生存曲线图,但Cox模型的功能并不止如此。如果在模型中加入其他对用户流失有影响的变量的话,模型能够对这些变量的影响情况进行分析。此外还能对变量的风险程度进行评估等等。

2、本次分析的时间精度为“周”,如果以“天”为精度,生存曲线将会更平滑,结果将更精准。

3、本次分析的流失也可以换成其他“关心的事件”,比如顾客的第一次购买行为等

4、需要说的是如果只要画上面的生存图表的话,使用EXCEL都可以画出来,上图只是根据时间维度对流失用户的频度进行统计和画图而已,本次使用SPSS一是因为操作方便,二是如果有需要还可以生成其他统计数据。所以分析主要在于方法,工具只是辅助。

本文固定链接: http://datakung.com/?p=431 | 数据控

版权声明:本原创文章由 数据控 于2014年12月31日发表在 方法工具 分类下, 你可以发表评论,并在保留原文地址及作者的情况下引用到你的网站或博客。
转载请注明: 生存分析Cox模型在用户生命周期分析中的简单应用 | 数据控
关键字: , ,

生存分析Cox模型在用户生命周期分析中的简单应用:目前有2 条留言

  1. 板凳
    :

    楼主,做得很好。我想请教你两个问题:1、关于做的第一个cox模型,也就是第一个生存曲线图,个人觉得用户注册一个星期,用户流失应该达到80%以上吧?注册一个月后用户绝对95%以上的流失吧?流失那么大,现实的数据已经是一个月了,是否在做用户维护就没用了?2、第二个cox模型,应该是app新用户注册的流失低于wap端的用户?

    2015-01-04 10:47 [回复]
  2. 沙发
    数据控:

    行业不同差异会很大,其次用户来源质量不同也会有很大差异。
    对于第一个问题,从分析上看注册次周流失没有达到80%,注册一月内流失量在90%左右;流失是难免的,做挽留和维护是在认识到流失问题的前提下,尽量把用户再次拉回来的无奈之举。流失用户不断积累,用户池子就会变的很大,这时累积的用户量与新用户已经不是一个量级的了,因为当用户量发展到一定时期时往往发展新用户比维护老用户(相对来说)成本要高很多,所以定期的对已流失的用户进行维护也是很有必要的;另外也可进一步分析用户生命周期特征,了解用户流失的主因素,预防用户过量流失。
    对于第二个问题,文中“来自app的用户流失情况好于wap用户”就是app新用户注册的流失低于wap端的用户的意思。在措辞上有些不严谨,我已经做了修正,谢谢指正。

    2015-01-04 11:12 [回复]

发表评论


快捷键:Ctrl+Enter