1. 首页
  2. 数据分析

数据分析模型:留存和间隔分析

留存分析的应用场景写法比较好,可参考;再结合其他文章会更好;

实际应用写的不太好;

 

640-65

“本篇主要讲解留存分析和间隔分析的应用场景,以及模型的实现思路”

 

 

01

留存分析是什么

 

    在互联网产品运营的方法中,最常出现的两个词:「拉新」和「留存」。两个词经常一起出现,是因为他们的目标都是一致的 —— 让客户进行访问。「拉新」是通过流量渠道来让客户访问,了解产品;「留存」是通过产品本身吸引客户,让客户自发的进行二次访问。

 

留存分析的定义

    用户使用产品后,在 N 日/周/月内仍使用产品,则认为是一次 N 日/周/月留存。

    这里我们可以稍微泛化一下访问的概念。通常我们认为用户打开了产品是一次访问,那么为了更加准确的定义「访问」这个概念,实际上不同的业务判断标准也是不同的,比如有些场景下认为「浏览详情」「进入列表」才是我们的有效访问。

 

留存分析的应用场景

    留存目标始终是很明确的,就是为了体现「用户存量」。

  • 场景 1:产品的在某一日上线了新功能,主要针对用户的留存做了针对性的改进,如:做了个签到送礼。接下来我们需要观察上线日前后,用户的次日留存是否发生了明显的改善。(策略验证)

  • 场景 2:我们想知道哪个渠道的新用户留存更好,我们可以将用户按照不同的渠道进行分组,观察不同渠道的 N 日留存情况。这里由于近观察一日的数据没有代表性,所以可能需要选择多日的数据,聚合后进行计算。(比较分析)

  • 场景 3:定量的观察分析,比如我针对一个指定的人群进行了运营活动,后续观察这个人群的留存是否有改观,和我未做运营的人群进行对比。(定量分析)

 

 

  

02

间隔分析是什么

 

    在数据分析中,常常会听到两个概念「转化时长」和「复购周期」。「转化时长」泛指用户完成 A 后,期望是进行 B,但是这期间因为各种原因导致需要消耗一定时间才可以完成 B,那么这个消耗的时间,就是我们想要的「转化时长」;「复购周期」的概念,可以理解为用户重复做一个事件,两次之间的相隔时间。

 

间隔分析的定义

    用户完成两个事件之间的间隔时长。两个不同的事件之间的时长,可以理解为转化时长、持续时长或是决策时长;两个相同的事件之间的时长,可以理解为复购周期。

 

间隔分析的应用场景

    间隔分析最核心的功能,就是把两个事件的时间间隔进行可视化的展示处理。在样本量充足的情况下,我们可以有以下几个场景的应用。

  • 场景 1:分析转化的决策时长,将两个事件的转化时长进行统计。我们可以得到一个转化时长的分布图,从图中可以很直观的观察到数据结论。通过中位数、平均数和四分位数的值,我们可以初步的判断出目前的一个转化耗时情况;当我们采取了优化的策略后,可以再次回来观察这个数字,是否向下偏移(变小),就可以侧面印证我们的优化策略是否生效了。(策略验证)

  • 场景 2:观察两个相同事件之间的发生间隔。如果是针对交易类的场景,可以得到一个复购周期的概念。我们将按照商品的类型进行下钻,便可以得到不同商品的复购周期。比如某个商品的集中复购周期是 7 天,那么我们就可以在第 6 天的时候,对购买过这个商品的用户进行针对性的运营,强化这个商品的推荐,从而促进再次成单。(运营信息)

  • 场景 3:视频类应用,尤其是短视频,更多的是消费用户碎片化的时间。那么一个视频最好的持续时长是多久呢?实际上这个最佳时间是与自己平台的内容形式、用户画像相关的,间隔分析可以很好的帮助我们获取到这个信息。(信息获取)

    

03

搭建留存分析

 

    接下来,我们来搭建一个留存分析的计算模型。

    第一步,根据选择的留存查看粒度,将数据进行整合,如:天级别留存就安天进行行为聚合,周级别就按照周进行聚合。

    第二步,计算留存:

  • 按天查看留存:从第一个日期为起始日期,依次遍历后续日期中是否发生了后续行为,若发生则标记为留存;从第二个日期为起始日期,重复上述遍历。最后,得到一个经典留存图。当日留存的概念是:用户在当天就完成了后续的事件。

640-67

  • 按分组查看留存:将一个用户按天查看留存的计算结果进行聚合,即认为:多天中,只要存在一天有 N 日留存,则认为该分组存在 N 日留存。(举个例子:以 3月2日为起始日期,用户存在 1 2 日留存,以 3月3日为起始日期,用户存在 1 3 日留存,则该用户的整体留存为 1 2 3 日留存)这里我们将一个用户仅能划分在一个分组中,原因如下:

    • 如果一个用户存在在两个分组中,无法判断究竟是哪个开始事件分组对留存造成的影响。

    • 如果想确定是哪个分组对留存造成的影响,就需要将初始行为和后续的行为进行一次关联。那么才可以解释为:因为做初始事件,所以做后续事件。

    • 于是,只有进行了开始事件和后续事件关联的情况下,一个用户才可能被划分到不同的分组中。

 

04

搭建间隔分析

 

    搭建一个间隔分析的分析模型,根据我们场景中的定义,间隔分析应该至少提供两种计算模型:

    • 持续时长类:特点是两个事件不是同一个事件

      • 假设行为序列为:ABAAB,那么应该返回 ABAAB 标红部分的间隔时间

      • 返回平均值、中间数、四分卫点等辅助数据,使用箱形图进行展示

      • 时间间隔的分布,使用热力图或线图进行展示

    • 复购类:特点是两个事件为同一个事件

      • 假设行为序列为:AAA,那么应该返回两个结果,分别为 AAA AAA

      • 返回平均值、中间数、四分卫点等辅助数据,使用箱形图进行展示

      • 时间间隔的分布,使用热力图或线图进行展示

    • 箱型图:

        •  

 

640-66

  • 热力图:其中横/纵轴可以为商品类型/复购时长

640-68

 

05

总结

 

    简单的解释了留存分析和间隔分析的应用场景。简单的归纳就是留存是用来做活跃相关数据分析,而且更多的是需要配合对比(时间上/分组上)来进行使用,从而获取信息。

    间隔分析是将时间的发生时间进行可视化的展示,从而发现产品或行为的规律,进而衍生出运营方案。

    分析模型最终都是服务于落地的场景,所以在分析不同场景时,选择最优的分析模型尤为重要。

 

    下一篇:我们来聊一下数据分析模型中的路径分析,看看这个炫酷的功能到底能带来多大的分析价值,适用在哪些场景中。

 

 

    

 

发表评论

登录后才能评论