游戏开发论坛

 找回密码
 立即注册
搜索
查看: 3467|回复: 1

[原创] 什么设计让游戏热度更久?来自门限回归模型的观点

[复制链接]

1万

主题

1万

帖子

3万

积分

论坛元老

Rank: 8Rank: 8

积分
36572
发表于 2020-5-15 14:01:50 | 显示全部楼层 |阅读模式
G(FHY~(ES}$)[GNH`HO85WE.jpg


声明:abraxas71投稿,转载需经作者本人同意

我力求客观,但绝不冷漠

——赖特·米尔斯


在游戏开发过程中,我们关心什么样的游戏设计对项目表现有正面影响。不幸的是,这种关心多数停留在猜想、模仿近期出现在媒体排行榜上的成功案例。前者表现在系统策划案里诸如提高用户活跃、黏性、留存、付费等名词套话中,后者仅模糊的存在正相关但哪怕同一公司也失败于模仿自己的前作。从业经验有时起作用,却受限于项目开发周期的反馈过长、职能等级与个人之见。

本文从数据分析的角度尝试回答上述问题,在此之前说明一些背景是有趣的。本文主要受了两方面的影响,一个是宾夕法尼亚大学的沃顿商学院经济学家Ethan Mollick在2011年发表的论文《People and Process, Suits and Innovators The Role of Individuals in Firm Performance》,论文使用了计量经济学方法考察了游戏在盈利上的成败与开发人员职能的关系,发现制作人由于整合、协调游戏设计师们的工作从而影响或贡献更大,表现在游戏设计人员的影响不到制作人的三分之一。另一个是前谷歌数据科学家赛思·斯蒂芬斯的著作《人人都在说谎》,书中用数据有力的阐明了一个观点:人们面对搜索引擎没有说谎、粉饰自己的动机。这使得赛思·斯蒂芬斯从谷歌趋势中发现了人们的言不由衷、夸大其词和藏匿的阴暗心理,如对伴侣的负面评价而非社交媒体上的正面展示、支持对外强硬的特朗普所在的州与种族歧视搜索地区的高度吻合等等。

起初,本文作者仅仿效赛思·斯蒂芬斯从谷歌趋势中得到有趣发现的方式,从百度指数、

360趋势、搜狗指数里随意查找一些关键词,比方说新冠疫情让临时抱佛脚去锻炼的人提高了至少一倍、中国女生对男朋友的标准强烈受韩剧的影响、中国男生则沉溺于小说和虚拟游戏的爱情里不可自拔同时苦恼于如何和女生聊天。由于本文作者隶属于游戏行业的数值策划岗位,所以也搜索了商业游戏,这些商业游戏都有一个高峰搜索量然后趋于稳定,但许多游戏的高峰时间跨度非常相似,另一部分游戏的时间跨度则明显更长。相似跨度的游戏似乎与业界划分的游戏类型、黑马与否关系并不大,比如刀塔传奇、阴阳师、皇室战争、绝地求生,它们的高峰持续时间相似的窄,而高峰跨度表现更长的有三国杀、炉石传说、lol、英魂之刃。于是作者提出了一个假设来区分这两类游戏:

1)研发牵引型。游戏主体玩法要求玩家尽可能投入时间成本,玩法欠缺时间不长的循环的、周期反馈,如阴阳师、刀塔传奇。或即便存在循环、周期的反馈,过程中也没有放松、紧张的交替性,而是要保持精神专注,如绝地求生、皇室战争虽然游戏是一局一局进行的但持续紧张并频繁的做出重要决策。

2)玩家可控型。游戏主体玩法较少的要求玩家持续投入时间才可获得奖励和防止落后,存在时间不长的循环的、周期反馈,并且过程中玩家可以放松神经而非始终保持专注,如三国杀与炉石传说在他人行动时是放松的、lol的大规模团战并不频繁发生且存在时不时的打野、打金空隙及匹配模式。

任何模型都是对现实世界的比喻和简化,且做出了一定假设。上述将观察法得到的两类游戏编码为“研发牵引型”和“玩家可控型”是一种假设,使用百度指数的搜索指数数据也是一种假设,我们假设搜索指数表达了对特定游戏的关注或这个游戏的热度。既然这些游戏有一个凸起的高峰然后趋于平稳,我们可以把高峰持续的时间、平稳期搜索量除以高峰期搜索量作为二次分析的数据,来考察是否的确研发牵引型游戏热度表现要弱于玩家可控型,换句话说更易使玩家疲惫、热情减退。

搜索指数是时间为标签,每个时间对应1个数值,所以它是典型的时间序列数据,需要运用时间序列的处理方法。而高峰期是一个模糊的概念,观察法还不够,我们使用门限回归找到高峰期的时间跨度。门限回归是使用多段线性逼近非线性的统计模型,它在预测的稳健性上要好于不少非线性模型如多项式拟合,根据自变量是否跨过一个门限值来决定使用哪个线性方程,所以,这个门限值对应的时间标签就能帮助我们找到何时高峰开始、何时高峰结束进入平稳期,两者时间相减即是时间跨度。门限回归的一个难点是到底分出多少段是合适的,我们使用MCP(极大极小非凸罚函数)自动筛选,MCP是一种渐进无偏的稀疏惩罚函数,估计出的模型和真实的模型别无二致,称呼为oracle性质,它能确切的将回归系数估计为0来识别一个多余的分段。

我们用TRM建模(门限回归)。其残差平方和模型为:
1.png



Φ为近似示性函数的标准正态分布函数,使得门限回归的不同分段可以组成一个连续的函数求解,示性函数用来判断自变量z是否大于门限值c进而选取不同的线性方程,由于是以时间为变量做回归,所以z和c事实上都是某个时间点。M表示分段数,p(θ)为MCP惩罚函数,它会自动惩罚不同段但回归系数θ相同的线性回归方程合并成一个方程来减少M,其表达式为:


2.png


γ是调节参数,λ为惩罚因子。

我们使用github开源的爬虫代码爬取了如下游戏的搜索指数:

研发牵引型:刀塔传奇,太极熊猫,阴阳师,皇室战争,绝地求生,魔灵召唤,少年三国志,不思议迷宫,明日之后,碧蓝航线,奇迹暖暖,恋与制作人。

玩家可控型:lol,王者荣耀,三国杀,英魂之刃,梦三国,小米超神,自由之战,英雄杀,炉石传说,部落冲突。

爬取的时间终点全部为2020-04-30,爬取的起点则依据肉眼观察和游戏上线时间,尽可能囊括明显高峰前的小段直线距离。本文判断高峰的标准是以门限回归的后一个线性方程的斜率减去前一个的斜率,选取差额的最大值和最小值视为高峰的开始和结束,两者相减即为高峰保持时间。然而拟合时发现,不论如何选取惩罚因子、M以及检查代码逻辑(含使用模拟数据验证算法正确性),均不能拟合成功,尤其是不能正确拟合高峰。经仔细分析,证明是因为模型中的作为窗宽的h过大导致,根据Seoy和Lintonz 的论文《A smoothed least squares estimator for threshold regression models.》指出,h趋于0,在样本趋于无穷大时,标准正态分布函数可近似示性函数。于是本文作者改写了h的计算方法,使之更趋于0。以下是部分游戏的拟合图:

明日之后


3.png


高峰起始于2018-10-29,结束于2018-11-30

王者荣耀


5.png


高峰起始于2015-10-04,结束于2018-11-05

横轴为时间,时间是以次序取值,纵轴为标准化后的搜索指数,标准化用以减少量级加快求解速度。以下是所有游戏的高峰起始与结束时间及差额:

6.png



门限回归选取出的高峰起始、结束时间点,通过观察搜索数据能够发现是合理的。虽然与肉眼观察的结果相对一致,但使用该方法有助于统一标准。图中可见使用了方差不齐的独立样本t检验,t检验是一种比较稳健的统计检验,并且t统计量也具有衡量效果差异程度的作用,一般超过0.8就是效果大,对高峰持续时间的p值检验也表明差异显著。我们用平稳期的均值除以高峰期的均值来消除游戏之间搜索指数量级之间的差别,得到的值表示这些游戏的“退热”大小,t检验表明差别不显著,但对效果量而言,1.5是相当大的效果差距。换言之,统计分析不仅证实了观察猜测的热度保持时间两类游戏存在差别,而且两类游戏的抗热度衰退也存在效果量评价角度的差别。

基于上述分析我们发现,一个牵引着玩家驻留在游戏里的游戏,不论其类型如何、是否被行业捧为黑马,并不能达到让玩家保持“黏性”的目标,且就平稳期而言的热度对比高峰期,衰退的也更为剧烈。相比之下,那些没有太多要求玩家投入的、有周期完结成就感的游戏设计更加细水长流,在保持玩家热情方面,平稳期的表现也更出色。但必须承认,不论使用多少统计分析手段,也只能证明两类游戏的高峰热度时间长度、抗热度衰退上存在差距,却不能明确证明差距的原因,我们只是假设低热度保持的游戏是玩家付出太多成本、保持紧张导致了疲倦,这是观察数据天生的缺陷——不是通过操纵自变量得到,但本文还是尝试性的迈出用数据分析游戏设计结构好坏的第一步。

我们在此带着一份质疑结束:项目失败总会发生、玩家热情总会减退,而面对众多的数据,游戏行业的人们却甚少发展和使用理性的方法加以认识,幻想着可以坐在高背椅里抓住事物的模式,现实反复证明,这种方式收效甚微。

巴比伦派数值策划Q群:813299364

0

主题

1

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2020-5-24 01:07:33 | 显示全部楼层
虽然贴主数据分析能力很强,但是从给出游戏分类和分析结果来看,所谓两类游戏热度持续性的区别,更像是当下竞技类游戏天生用户粘性更强的表现而已。
贴主对两类游戏分类的标准似乎有点主观,比如lol王者荣耀打野时真的不需要随时思考局势和下一步战略吗?阴阳师回合结束后又是否存在看动画、对方操作的相对放松时间呢?所谓“研发牵引型”和“玩家可控型”的分类有些牵强。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

作品发布|文章投稿|广告合作|关于本站|游戏开发论坛 ( 闽ICP备17032699号-3 )

GMT+8, 2025-3-9 23:41

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表