|
本帖最后由 66team.com 于 2014-11-19 18:06 编辑
GameRes发布,作者:非典,66team投稿
对于任何一个游戏产品来说,用户规模都是基础中的基础。相信不少做游戏数据分析的同学们都被老板问到过这样一个问题,游戏今年有X人,你能否告诉我明年会有多少人?
由于游戏产品受到竞品(剑灵开测端游MMORPG集体滑铁卢)、外部事件(如世界杯春节)、自身运营活动(开个登陆活动活跃瞬间暴涨)等诸多因素影响,要预测用户人数并不是一个容易回答的问题。特别是对于一个成熟产品而言,新用户数量、流失回归用户数量、口碑传播等都会对成熟产品的数量产生影响。而成熟产品的用户成分复杂,流失与否波动性较大,更容易给预测模型带来误差。
相对而言,如果有测试阶段的相关数据,则预测一个新游戏的用户规模会相对容易。但需要说明的是,任何模型都要基于一定的假设才能成立。而这些假设的先决条件,往往在不同环境下有差别甚至不成立。因此,不存在一个通用于所有游戏的模型。本文仅介绍模型建立的思路及方法,细节之处还需根据产品自行调整。
一、模型假设
1.每日新登录用户 Px
假设条件:对于一个新推广的产品而言,我们假设其原始用户初始为0。
推广第1天进入游戏的新登录用户为P0,推广第2天为P1,推广第X天为Px-1。
假设条件:新登录用户的成分组成不影响其数据表现。
新登录用户中,可以根据来源分为诸如广告获取、活动导入、口碑传播等,在这个模型中将所有用户均视为一个整体。
需要说明的是,在现实推广中,登录用户的成分会极大影响该批用户的数据表现。如通过百度品牌词导入的用户其后期留存充值是网盟用户的数倍。在用户成分组成不稳定的 条件下,做人数预测的误差会很大。
当然,如果要做精确预测,可以将不同成分用户留存表现单独建模,本文不详细说明。
2.沉淀用户Cx
假设条件:本文为新游戏用户规模预测,因此不考虑流失回流的情况。
沉淀用户可理解为核心用户,这部分用户已经经过了留存急速下降的阶段。留存与否受到新手和产品内容影响较小。当一批用户的留存出现上下波动,且持续了一段时间之后,则可认为该批用户已成为沉淀用户。
沉淀用户的流失率可以用一个普适的流失系数a来表示。一般来说沉淀用户的流失系数都是非常小的。
不同游戏的用户沉淀周期千差万别,本文实例中的沉淀周期为70天。
3.留存用户Ux
既不属于该日新登,也不属于沉淀用户的用户,定义为留存用户。留存用户由第一日新登用户到本日留存数+第二日新登用户到本日留存数+第X日新登用户到本日留存数组成。
为何要单独将留存用户划分出来而不是和沉淀用户合并为一个类别呢?
因为新用户在进入游戏后的留存率,并不是每天按照一个定值系数递减的,如果这样建模会令结果产生巨大的误差。
4.总用户数Sx
显而易见,新游戏上线X天后,用户数Sx=Px+Cx+Ux
二、模型构建
假设条件:开服后无论多少天进入游戏,其留存表现无明显差异。
实际上,开服后几天进入游戏,对端游来说留存表现差异明显,后续会用实例进行说明。
1.留存用户Ux的计算方法:
首先,定义第N天进入游戏的用户在第X天的留存人数为 Pn*f(x-n)
其中,f(x)为留存率预测函数,可使用最小二乘法通过次日、3日、7日留存求得。本文 实例数据计算出的f(x)为对数函数。
则第X天留存用户总数:
2、沉淀用户Cx的计算方法:
由于我们假设70天之后,用户变为沉淀用户,定义70天后,留存用户变为沉淀用户,则沉淀用户在70+y天后的留存为Pn*f(70)*a^y。
令c=f(70),x=70+y,则沉淀用户计算公式为:
3.总用户数Sx的计算方法:
规定n=x-1
三、模型实例检验
以下为某款新游戏在测试阶段的数据。基于数据保密原因,实例中结果数据是在真实数据基础上进行了一定的处理。
1.留存率函数f(x)的获得:
由真实留存率图像看,该曲线拟合应为对数函数,使用回归分析可获得对应的拟合函数。
2.获得留存率拟合函数后,进行计算:
日期 | 实际登陆数 | 预测登陆数 | 2014/4/16 | 34529 | 34529 | 2014/4/17 | 23357 | 20280 | 2014/4/18 | 19737 | 18767 | 2014/4/19 | 18884 | 18067 | 2014/4/20 | 17718 | 17456 | 2014/4/21 | 20243 | 19925 | 2014/4/22 | 21345 | 21291 | 2014/4/23 | 21623 | 21285 | 2014/4/24 | 20173 | 20929 | 2014/4/25 | 20805 | 20743 | 2014/4/26 | 20284 | 20450 | 2014/4/27 | 17344 | 19845 | 2014/4/28 | 15354 | 19108 | 2014/4/29 | 14736 | 18443 | 2014/4/30 | 14091 | 17861 | 2014/5/1 | 13800 | 17586 | 2014/5/2 | 13724 | 17243 | 2014/5/3 | 13994 | 16981 |
从上表看4月16日~4月26日间,预测拟合效果还不错,但4月27日后拟合出现了较大误差。
那么造成此误差的原因是什么呢?
3.误差分析及模型修正:
从上图不难看出,推广第1天至第5天,留存率数据表现都差不多,但第六天后,数据表现差异明显,拟合函数已经从对数函数变为幂函数。因此才会造成后期拟合数据的差异。
将开服后6天的留存率拟合函数替换为幂函数后的结果如下:
日期 | 实际登陆数 | 预测登陆数 | 2014/4/18 | 19737 | 18767 | 2014/4/24 | 20173 | 20652 | 2014/4/25 | 20805 | 19726 | 2014/4/26 | 20284 | 18855 | 2014/4/27 | 17344 | 17746 | 2014/4/28 | 15354 | 16532 | 2014/5/16 | 10783 | 10896 | 2014/5/26 | 10166 | 9783 | 2014/6/5 | 8349 | 7713 | 2014/6/15 | 6796 | 6397 | 2014/6/25 | 5506 | 5456 | 2014/7/5 | 5201 | 4651 |
四、模型分析
基于此拟合模型实例,我们可以测试一下,当游戏数据发生以下变化时,游戏用户规模会发生什么样的变化。
1.次日留存率提高5%:
在导入用户量不变的情况下,30日后用户规模会上升到12951人,比原拟合数据10896提高了18%。
2.后期导入用户留存率与前期无明显差异: 在导入用户量不变的情况下,30日用户规模会上升至17280人,比原拟合数据10896提高了58%。可见,若不能一周开一服,则应设计活动提升后进玩家的周留存和月留存。
基于此用户规模预测模型,结合用户的arpu值等数据和计划的导入用户量,即可粗略预估产品在一般情况下的收入情况。
【版权声明】:66team所发文章,全部为团队成员原创,转载请务必注明原文出自:66team,谢谢!
http://www.66team.com
|
|