游戏开发论坛

 找回密码
 立即注册
搜索
查看: 70990|回复: 7

小白学数据分析-->日活跃人数分析

[复制链接]

1万

主题

1万

帖子

2万

积分

管理员

中级会员

Rank: 9Rank: 9Rank: 9

积分
20356
QQ
发表于 2012-3-16 00:48:00 | 显示全部楼层 |阅读模式
博客:data-intelligence

小白学数据分析 目录

  从今天开始,特开辟一个小专栏,题目暂定为小白学数据分析,鄙人不才,在数据分析的道路上走的崎岖坎坷,同时数据分析本身是一个多面和复杂的工作,要懂得理论(统计、概率、数据挖掘、算法、模型)更要懂得业务,懂得行业理论,还要有灵活多变的思维,想想还是很复杂和麻烦的,所讲内容不但是理论,不仅是数据,尽量把这些东西综合起来,立体的来看,鄙人水平有限,很多的内容是尝试和改进,参考了很多的材料,在木有高人指点和牛人帮助的情况下,我只能借助浩瀚的网络知识和自己的悟性,今天决心拿出来给各位主要是帮助大家和我一起进步。

  第一天就从一份数据的分析开始,这里面涉及了很多的内容,大家需要慢慢理解。

案例:

  某位网友提供了一份游戏的日活跃账号数的数据信息,游戏是从2011年9月份开始了测试,到2012年2月,但是产品究竟表现如何,从PLC(产品生命周期----《营销管理》)来看,产品目前处于一个什么时期,下一步怎么来做营销和运营工作,这是一个需要关注的问题。今天就从日活跃这个数据指标的解析上简单看看PLC的解读。

  设计分析的数据指标有很多方面,总体来说就两块,收入+人气,我们就从对人气的分析上下手,考虑文章篇幅关系,今天单列每日活跃的分析过程,其他指标的把握和分析基本和此相同,大家可以自己尝试完成。



术语解释:

每日活跃用户(DAU):每日登录过游戏的玩家数量(重复登录者不累加)

IB:Item-Billing,游戏中通过游戏币交易流通的道具

APA:活跃付费账号数

PLC:产品生命周期-----《营销管理》

ARPU:平均每名玩家盈利能力

新登用户:每日注册成为游戏玩家的数量

每日有效活跃玩家:达到某一个指标(一般是在线时长)的日活跃玩家数量

每日有效新登用户:达到注册并成功登录进行过游戏的玩家数量


为什么要看每日活跃用户?

  抛开游戏上线初期的推广营销因素影响后,版本随后会进入真正意义上的成长和发展阶段,这个阶段也是对于游戏品质和开始阶段投放影响的评估(当然这种靠推广的影响会存在一定的时效性,在对于DAU分析时,要抛开这个阶段)。每日活跃用户的变化说明以下的原因:

  人气波动:建立每日活跃人数的弹性数值区间(阈值),当然这点的预警要按照每个月的具体情况来看,比如每个月的节日,假期,学生开学等其他因素的影响情况,建立一套因素影响指数,并作用于人气波动的预警。

  趋势走向:综合一个阶段的日活跃变化情况,对于重大拐点和趋势进行分析,并预测下一个周期的变化形式。

  产品质量:从日活跃的趋势变化和人气波动等其他因素综合看产品版本更新,活动设置等对于产品的PLC的影响,以及产品质量是否符合玩家的预期(质量的定义很广泛,这里比如IB设计,系统设计,交互体验等等)。

  影响因素:正如刚才所言,我们综合一个周期的日活跃数据 和其他数据制定影响因素指数,便于宏观把控数据的变化,比如进入预警范围的数据究竟因为这些影响因素的影响有多大。做到心中有数。

  当然,以上是简单的列举了一下日活跃用户参与的数据分析的几个方面和作用,对于数据分析千万不能局限在一个指标而进行所谓的分析,要全面的结合其他指标进行衡量和分析。比如新登用户,收入数据(充值,ARPU,APA等等)。




怎么来分析DAU?

  如之前文章所说,我们主要运用曲线图和箱线图来分析DAU数据,如下图,使用IBM SPSS 19进行箱线图的分析(其详细过程以后在叙述)。

  再次箱线图中涉及几个术语指标,先给各位再解释一下:

  方差:度量随机变量和其数学期望(即均值)之间的偏离程度,测度数据变异(离散)程度的最重要的指标,方差是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。方差的计量单位和量纲不便于从经济意义上进行解释,所以实际统计工作中多用方差的算术平方根——标准差来测度统计数据的差异程度。

(http://wiki.mbalib.com/wiki/%E6%96%B9%E5%B7%AE)

  方差和标准差也是根据全部数据计算的,它反映了每个数据与其均值相比平均相差的数值,因此它能准确地反映出数据的离散程度。比如,平均日活跃为A,通过方差判定整个这个月的DAU波动情况,以及距离A的离散程度。

  期望:广义的来说,是指人们对每样东西的提前勾画出的一种标准,达到了这个标准就是达到了期望值。从概率论和统计学中,离散型随机变量的一切可能的取值xi与对应的概率Pi(=xi)之积的和称为该离散型随机变量的数学期望(设级数绝对收敛),记为E(x)(http://baike.baidu.com/view/295737.htm),我们多数情况下只讨论离散型期望。

  中位数:中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。中位数用Me表示。

  从中位数的定义可知,所研究的数据中有一半小于中位数,一半大于中位数。中位数的作用与算术平均数相近,也是作为所研究数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。

  在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响;如果研究目的就是为了反映中间水平,当然也应该用中位数。在统计数据的处理和分析时,可结合使用中位数。

(http://wiki.mbalib.com/wiki/%E4%B8%AD%E4%BD%8D%E6%95%B0)

  四分位数:将数据划分为4个部分,每一个部分大约包含有1/4即25%的数据项。这种划分的临界点即为四分位数。它们定义如下:

  Q1=第1四分位数,即第25百分位数;

  Q2=第2四分位数,即第50百分位数;

  Q3=第3四分位数,即第75百分位数。

(http://wiki.mbalib.com/wiki/%E5%9B%9B%E5%88%86%E4%BD%8D%E6%95%B0)

  四分位差:四分位差又称内距、也称四分间距(inter-quartile range),是指将各个变量值按大小顺序排列,然后将此数列分成四等份,所得第三个四分位上的值与第一个四分位上的值的差。四分位差用公式表示:

  Q = Q3 − Q1

  其中:Q1的位置=(n+1)/4

  Q3的位置=3(n+1)/4

  四分位差反映了中间50%数据的离散程度。其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。与极差(最大值与最小值之差)相比,四分位差不受极值的影响。此外,由于中位数处于数据的中间位置,因此四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。主要用于测度顺序数据的离散程度。当然,对于数值型数据也可以计算四分位差,但不适合于分类数据。

(http://wiki.mbalib.com/wiki/%E5%9B%9B%E5%88%86%E4%BD%8D%E5%B7%AE)

  其以上的几个信息的示意图如下所示(http://wiki.mbalib.com/wiki/%E7%AE%B1%E7%BA%BF%E5%9B%BE):





下面我们从这个箱线图来分析一下DAU的近期变化情况



  除了2012-Jan以外,都没有离群点或者极限值,相对而言,每个月游戏人数整体比较稳定,没有发生巨大的变化。而在2012-Jan出现了两个离群值,调查发现,是1月4日和1月5日出现的问题。经过CCU曲线分析,发现关键节点数据变化很小,但是24小时总体出现微下降,说明玩家4日和5日的活跃数据被稀释了,此外,通过对竞品的分析发现4日和5日有线上领取活动,再者,节后两天学生基本需要返校和白领休假归来,造成数据暂时下滑。

  此外,我们拿到分析数据和上图来看,12年二月份和11年9月份的中位数较高,说明这段时间内的平均日活跃相对于本月来说较高,这可以看出这段时间内,游戏内的用户上线较为频繁(当然此处要结合PCU,在线时长来看更加准确)。

  9月份为开始测试的月份,而2月份为假期阶段,因此玩家上线的意愿相对来说会比较高一些。这也是在意料之中的情况。



  然而11年的11月份和12月份,中位数偏低,玩家上线意愿不够强烈,11月份已经非常低了,主要原因在于这一时期玩家进入考试周期,四六级,中期考试等等,属于淡季阶段。

  11年10月份国庆节期间,玩家上线意愿还算不错,但是没有达到理想的效果,中位数低于平均水平,因此国庆假期的活动或者推广效果不是非常理想,间接也导致了下个月下滑的非常迅速,因此下次节日活动需要进行重新评估和调整。数据如下:



  对于12年一月份的表现算是情理中,今年由于1月份过年,然而过年7天玩家的游戏时间其实是缩水的,没有太多精力投入游戏,但是从箱线图来看,表现还算正常。高于平均水平,活动效果应该比较不错,一月份虽然出现了两个离群值,但是一月份的标准差是最小的,也就是说一月份整体的活跃趋势稳定,没有大的波动。



  总体来看,如果要考察PLC,需要结合收益数据,以及其他的诸如ACU,PCU,新登等数据来综合看待PLC,但是从DAU来看(狭义来说),人气在几个月来保持相对的稳定,但是整体上经历了小幅的下滑,换个角度说,这款产品存在一些问题,人气持续稳中有降,可以说玩家度过初级的新手期后,中间的成长、竞争、追求阶段出现了问题,诉求不能满足,导致人气下滑。更加详细具体的原因需要更多的数据综合分析。

  注:以上分析皆建立在与数据的对比之上和其他辅助的数据综合分析上,当分析者单纯观察一段数据时,不能通过中位数高低轻易下定论认为用户上线频繁与否。需要考虑很多的客观因素。

  明天我们说说怎么再从曲线图来分析一下这几个月的日活跃变化情况。


小白学数据分析 目录

161

主题

1372

帖子

2749

积分

金牌会员

Rank: 6Rank: 6

积分
2749
QQ
发表于 2012-3-16 10:53:00 | 显示全部楼层

Re: 小白学数据分析------>日活跃人数分析

一般数据分析不会怎么多方面吧,我说下之前我知道的情况:
第一、新增充值账号上升比例,持续充值账号比例,啊铺值,只要对比这些就可以得到游戏的第一天或者一个阶段玩家消费意愿强烈与否,不强烈的原因是什么,人气少、骂人多、公会少、指引性不强烈、玩家目标设置有问题、玩家阶段目的没有表达出来、玩家没有战斗欲望、玩家没有被战斗欲望等,强烈的原因是什么,目的很明确、阶段目标达到后能占领打装备的优先权,公会集团式很有群体目标,被强制战斗的紧迫,超越或者被超越的紧迫。

第二、上线率和长时间在线率的对比,说明用户意愿和游戏性的对比,基本上就决定了这个游戏的生死,所以活动的滚动式播报、每日领取奖品、在线多长时间领取什么消耗品、多长时间上线一次收获自己的庄园或者资源播种的模式,都是为了增加上线率和在线率,再有的就是存在感了,这个就要和浏览器的话语来判定,如果一个玩家在游戏里面只是玩不喜欢交流,这个就证明了游戏代入感很差,没有存在的感觉,孤独的性,必然会造成用户突然间不知道为什么就不见了,所以聊天框很重要,刷新的频率和交流的频率其实后台都可以调出一个表格出来查看字数的,你可以根据字数来判定比例。

第三、流失率和核心玩法比例,正常的情况是是10%的人喜欢玩核心玩法,流失率控制在84%就可以了,正常情况下都喜欢预设的模式来增加核心玩法的比例,比如说一些玩家不可能在某一个点参加某一个比赛,所以我们可以设置好一套预先动作给玩家选择,只要玩家选择好预设动作,设置好在某一个点参加某一个活动或者比赛,就按照他现在的装备和状态投映一个人在等待活动或者比赛的模式,这样的话就由一点牵挂我的预设会不是拿第一啊,我的预设会不会得到好成绩啊,有了想法才有继续上线的情况,流失率才会低,还有核心玩法比例,真正增加活跃度的关键是核心玩法的展开和展示,展开的意思就是说怎么引导,怎么铺设常规路线和不常规路线,常规路线是需要花时间准备,不常规路线需要花钱来准备,怎么展示,很简单,比赛录像或者比赛战报或者比赛排名来展示,通常很少人看,但我们可以通过展示在游戏的关键位置来增加展示力度。


这些东西和节假日和上学放假无关,因为你数据分析的结果是节假日和放假上班高峰期或者某一个事件吸引了关注度,那么你去百度下就可以知道了某天的情况和某阶段是放假或者什么什么的,数据分析就拿来分析什么节假日和上班高峰期呀?又不是开服务器的时候选时间,数据分析是一个游戏里面活跃的综合报表不是分析为什么,不是分析怎么会,而是分析预判的结果和接下来要做什么,这才是关键。

0

主题

1

帖子

4

积分

新手上路

Rank: 1

积分
4
发表于 2013-4-10 11:08:58 | 显示全部楼层
文章写得很好,也很在理,但是作为一名游戏运营,很多时候,我都在思考一个问题,就是这么深入去做数据的精细化分析,对游戏的整体运营性价比高不高?
现在的游戏团队非常多,但这些团队里面真正有这么专业的数据分析人才的是少之又少,绝大部分的游戏团队都是运营兼顾一些数据分析的工作,而这些运营也都不是统计分析等等专业出身的,对真正的数据分析本来就是先天性缺少理论基础与实践经验,日常工作中基本只是通过游戏后台抓取数据再在excel中做一些简单性的对比分析而已,SPSS,水晶易表等等这些专业性的工具基本没怎么用过。对于如何提高玩家活跃度,游戏年度,付费比等等,更多的是依靠平时工作中的经验与直觉,运营与策划两个岗位共同作用的结果。
在这样子的一种没有专业数据分析部门或数据分析员的情况下,月流水破千万的游戏(暂指网页游戏)也是有很多,而有专门数据部门或分析员的游戏,做死的也不少。
其实我也不是说做数据的精细化分析不好,现在大数据的概念很火,有能力的公司都开始大投入做这方面的,未来肯定是个趋势。只不过是对于普通的短寿命游戏来说,这就要考虑性价比。因为一款页游成不成功受很多方面的因素,公司战略,平台资源,竞品情况,市场趋势等等,要综合起这些一起来分析,是非常复杂的一般难以做到,而单单只是去从游戏本身或者渠道等来分析,却又是片面的,毕竟你通过数据来分析得出把一款游戏寿命从2年延长到5年是没什么意义的,市场的大环境是吃快餐,玩家的口味改变比策划的思维还快。
以上仅是我个人的看法,我也一直在学习怎么做数据分析,大家多多交流!

32

主题

774

帖子

1729

积分

金牌会员

Rank: 6Rank: 6

积分
1729
QQ
发表于 2013-4-16 23:16:32 | 显示全部楼层
顶一下楼主,谢谢分享

1

主题

8

帖子

30

积分

注册会员

Rank: 2

积分
30
发表于 2013-10-25 10:59:13 | 显示全部楼层
本帖最后由 dianyii 于 2013-10-25 11:03 编辑

谢谢分享,我现在才开始学习这方面,对我入门的作用很大!

0

主题

3

帖子

8

积分

新手上路

Rank: 1

积分
8
发表于 2014-10-25 17:48:45 | 显示全部楼层
怎么没有图啊

0

主题

2

帖子

8

积分

新手上路

Rank: 1

积分
8
发表于 2014-11-17 16:23:13 | 显示全部楼层
看不到图,求指教,需要看图学

1

主题

44

帖子

154

积分

注册会员

Rank: 2

积分
154
发表于 2016-2-17 22:21:49 | 显示全部楼层
普罗米修斯说的不错,我们分析的太少,都是根据经验控制而游戏运营!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

作品发布|文章投稿|广告合作|关于本站|游戏开发论坛 ( 闽ICP备17032699号-3 )

GMT+8, 2024-3-29 02:33

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表