游戏评分的效用与偏好含义分析（二）：效用分析

liefeng603 · 发表于 2018-11-30 09:18:09

文/浩阳

*本文系笔者课程作业，略有删改。

自21世纪以来，互联网的普及以及电子技术飞速更新为游戏的高速发展创造了条件。如今，游戏已经逐渐成为数亿国人日常生活中不可或缺的一部分。同时，在信息时代背景下，各类游戏与应用平台迅速崛起，作为平台的核心价值所在，有关游戏的评价信息出现爆炸性增长，其中，游戏评分作为最直观的数字化信息，其对游戏消费者消费行为的影响也在迅速提高。这使得对游戏评分内涵的分析具有一定研究意义。本系列文章从微观经济学消费者理论视角出发，简要分析了游戏评分的效用与偏好内涵的理论基础与现实意义。

游戏评分与游戏效用

从形式上看，以消费者发布的量化评价为原始数据经过一系列程序计算得出的综合评分属于在线用户评论（online user reviews, OUR），后者又属于用户生成内容（user generated content, UGC）的一种。从二者入手可对游戏评分的内涵与边界做出界定。

早在上世纪90年代亚马逊购物网站就已经开始为其消费者提供发布在线评论的平台，而对其的研究则略显滞后，在本世纪初才开始出现。Vickery和Wunsch-Vincent（2007）总结出UGC的三项普遍特征：网络公开发表、具备创新性、创作者为非专业人士。Park等（2008）在此基础上对UGC做出定义：由以前的、当前的或潜在的消费者根据其对产品和服务的体验、评价或看法所做的所有正面或负面陈述。Sridhar和Srinivasan（2012）缩小范围，针对OUR进行研究，将其定义为网络平台中由消费者发布的有关产品或服务体验的量化或实质性评价。上述两种定义都没有区分消费者评价中包含的两种不同信息——文本信息和评分信息，本文所述“游戏评分”显然仅涉及后者。Mudambi和Schuff（2010）则对OUR做出非常接近于游戏评分的定义：由消费者创作并发布于厂商或其他第三方网络平台的产品评估结果，其内容常见于数字化的星级评分（上限可以是5分、10分、100分或是其他标准）。

亚马逊商城的评论界面

综合上述观点，本文对游戏评分做出以下定义：消费者针对游戏产品与服务的体验，综合考虑所有正面或负面陈述而做出的数字化评价[1]。

对OUR和UGC的研究者而言，消费者对产品和服务的公开评价本身是一种很令人匪夷所思的行为。因为发布评价这一行为会给消费者带来额外的高成本（即在支付对价、上手体验之后还需要投入额外的时间、精力编辑评价），同时却不会给消费者提供传统形式的收益（Zhao et al., 2013）。那么，为什么消费者会如此热衷于发布OUR、UGC呢？再具体一些，为什么游戏消费者这么乐此不疲地对游戏打分呢？不同研究者之间众说纷纭，各执一词，其代表有社交说、从众说、自我实现说等（Christodoulides et al., 2011; Moe & Schweidel, 2012; Hennig-Thurau et al., 2004）。本文认同Dellarocas与Narayan（2006）的“满意度说”观点，即在消费者发表评价的众多因素中，其对产品和服务的满意度是最主要也是最核心的因素，其他因素仅仅能产生一定程度的影响，而对产品和服务满意与否则是主导评价的核心要素。满意度作为游戏评分产生的目的与动机，由此出发也能对游戏评分的标准进行分析。

与人社交被认为是评论的重要作用之一，特别地，有人认为社交是游戏的基本功能。不过，本文仅将至视作游戏评价的从属作用

早在上世纪80年代，就已经有学者对满意度这一概念进行研究。Oliver（1980）将满意度定义为消费者对产品或服务的预期与在实际体验中感知到的效果之间的比较。在满意度的产生机制方面，当前最为公认的一个观点是其由情感与认知机制共同引发（Oliver, 1991; Homburg et al., 2006）。

其中，情感是指与具体事件或行为引发的强烈感受（Cohen & Areni, 1991），Hirschman和Holbrook（1982）基于人类行为的终极动机是追求快乐的假设前提，提出情感是影响消费行为的主要动机，即消费者从产品或服务中获得的快乐感觉促使的消费的发生。这一观点符合我们的直觉，我们能够认同消费者对游戏消费的兴趣总是来自于其能够带来的快乐，即总是“为了好玩”，当这种情感是正向的，即快乐的程度很高，游戏“很好玩”，消费者总是倾向发布较高的评分；相反，当情感是负面的，快乐的程度较低，甚至没有快乐，只有消极感受，游戏“不好玩”，消费者就会发布较低的评分。

丰富多样的情感

同时，认知也是影响消费的一大动机。相关研究主要以期望-差异模型（Expectation-Disconfirmation model）作为分析框架，认为消费者对产品和服务的预期与实际感受之间的差异是影响满意度的主要因素。当这种差异是正向的，即消费者预期优于实际感受，那么消费者的认知将会产生“失望”等情绪，进而对满意度产生负面作用；相反，当这种差异是负向的，即消费者预期低于实际感受，那么消费者的认知将产生“惊喜”等情绪，进而对满意度产生正面作用（Oliver & DeSarbo, 1988; Kristensen et al., 1999）。

综合两种机制来看，情感机制是消费者对游戏的一种绝对比较，在消费者实际体验之前难以形成一定预期，而认知机制则是一种相对比较，消费者在事前有一定预期作为基础，之后可根据预期进行二次修改。表1以这种“情感-认知”综合框架对国内某手机游戏平台建议的评分标准进行分类。

无论是情感机制还是认知机制，其对满意度的影响都是建立在消费者对游戏产品和服务的感受之上。而游戏评分作为这种主观感受的数字化表现，显然是符合效用定义的，即是游戏对消费者的满足和有用性体现。由此，我们得到以下结论：

结论1：游戏评分是消费者根据游戏体验感知到的效用表现。

对于手游，则是基于移动设备交互而产生的效用

基数效用还是序数效用

基数效用论和序数效用论是效用理论的两大派别。基数效用论（cardinal utility）将效用视作可直接计量的一个概念，其大小可用一定基数表示；而序数效用论（ordinal utility）则认为效用作为人产生的一种心理现象，是无法量化观测的，也不能直接进行算术计算，只能表示产生心理作用的相对水平，并用于定性分析。上文已将游戏评分明确为游戏效用的衡量，那么紧接着的问题就是，这种效用衡量方式属于基数效用还是序数效用？让问题表述再准确一些——游戏评分的现实含义更接近于基数效用，还是更接近于序数效用？

从表现形式上看，游戏评分以数字形式展现在消费者眼前，似乎在从根源上宣布自身对基数效用的归属。同时，在个体层面，基数效用理论也在相当程度上对游戏评分适用。对单个消费者而言，尽管“人不可能两次踏入同一条河流”，人总是处于永恒的运动与发展状态中，但“其对游戏的评分标准不变”仍然是一个较弱的假设。我们能够相信，一个消费者基于道德观念的公正心理，或是受从众、社交等心理驱动，会产生自觉维护游戏评分前后标准一致的动机，并且这个动机在整个评论不同游戏的过程中是很强的、不易改变的。如此一来，一致标准下的游戏效用量化比较就是有意义的。例如，在五星制下，一星可表示极差、令人愤怒的游戏，而五星可表示令人产生惊艳、狂喜等情绪的游戏，其他评分则分别表示两种极端满意度中间水平的效用，并且对这名消费者，高星（更高评分）游戏总是比低星（更低评分）游戏拥有更多效用。

评分的量化不能

但仅仅凭借这一点就断定论断游戏评分的现实含义更接近于基数效用是不可信的。基数效用论的适用性仍然存在许多瑕疵。最明显的一点就是延续上述分析，若假设不成立，即消费者无法维护游戏评分标准的统一，那么是断然不能将游戏评分视作基数效用的。比如，这个消费者的评分标准逐渐变得严苛，其对三星的定义从“及格”变为“极优”，对二星的定义从“极差”变为“良好”，那么可以看到，变更标准后的二星评分实际要优于变更标准前的三星评分，即评分数字变低，其产生的效用反而增多。

要注意，上文仅仅限定在个体层面，把范围扩大至群体层面后，基数效用论的适用性将更加受限。延续上述分析，个体的游戏评分标准尚且可能不统一，更妄论群体的标准了。在群体层面，最直接的一种分析方法是将所有参与评分的个体糅合加总视作一个特殊的个体，即对一个游戏，将其计算出的总评分视作该游戏在所有评分个体的标准加权产生的一个“加总”标准下得到的评分。这种逻辑下的游戏评分能够用基数效用论解释吗？答案仍然是否定的，原因在于，对不同的游戏，其评分的群体完全一致的概率趋近于零[2]，如果假设不同消费者的评分标准存在差异，那么就能推出不同游戏的“加总”标准总是存在差异，也就是说不同游戏的群体评分也存在上述个体层面所包含的标准引致的无意义。比如，令游戏A的群体评分为三星（6.0分），令游戏B的群体评分为二星（4.0分），我们无法判断，两个游戏背后的“加总”评分标准是否存在上述个体层面的严苛变化趋势，进而也就无法做出“游戏A一定比游戏B好（效用价值高）”的推断。我们可以将之总结为以下结论：

结论2 游戏评分的内涵更接近于序数效用，并且评分高低不反映效用价值高低。

这一结论具有很强的现实意义。我们在不同游戏中进行选择时常常会参考先验的群体评分，并且不时会做出“因为A的（总体）评分比B高，所以A比B好玩，我选A”的推断。这种推断暗含着“高群体评分对应高效用价值”的逻辑跳跃。以上分析说明，这种推断在逻辑上是不准确的。

另外，从结论2还能进一步做出一个有意思的推论：

推论2.1 意见领袖（包括媒体组织或个人）做出的游戏评分可能不具有高水平的参考意义。

在如今的信息时代，消费者体验游戏之前参考各种意见领袖的评分已成为一种普遍习惯，各种游戏自媒体大行其道，手中握有大体量的用户流量，还有部分游戏直接将获得的高评分作为标榜自己的宣传手段。但是，本文的上述分析显示，这些意见领袖的意见似乎不具备过高的参考性，这种参考性缺失不是由寻租、作假等技术手段所致的，而是其评分本身的性质造成的。仍采用上述分析方法，将意见领袖，不论是组织还是个人，均视作一个单独的个体，其可能同时具有两套评分标准——一是和上述分析相同的“加总”标准，二是受公众的中肯、专业、公正的期望驱动，其做出的评分可能是一种对群体评分的预测。

如果是前者，那么根据上文个体层面的分析，其评分存在时间维度的变化风险和个体维度的差异风险，两者加和导致其评分仅仅在个体层面存在意义，而无法扩及群体层面；如果是后者，从逻辑上看不存在以上两种风险，但这又提出新的挑战——如何保证评分预测是准确的？实际上，在群体评分释出之前，我们永远无法直接看到预测意义上的评分准确与否。如果要从侧面进行印证的话，那么这些意见领袖需要严格地采取市场调研举措，包括产品调研和用户调研，以全面体现游戏特征和群体“加总”标准特征，否则，做出的评分都是一种主观臆测。

每个评分都反映且仅反映独立的个体感知

注：

[1] 注意到，本文的定义将所谓“云玩家”排除在游戏消费者的范围之外。对于“仅观看视频或直播是否属于游戏消费行为”这一问题仍存在较大争议。本文暂且认为游戏对消费者的效用产生于消费者实际上手体验的过程，并据此将这一过程之外的所有行为不认定为游戏消费行为。

[2] 在现实当中，让同一批人同时对不同游戏打分，同时保证人数不增不减、人员不变几乎是不可能的。

来源：TAPTAP
地址：https://www.taptap.com/topic/4310732

相关阅读：游戏评分的效用与偏好含义分析（一）：价值理论分析

账号		自动登录	找回密码
密码			立即注册

[分享] 游戏评分的效用与偏好含义分析（二）：效用分析

相关帖子