游戏开发论坛

 找回密码
 立即注册
搜索
查看: 2566|回复: 0

[原创] 博弈论是如何用于游戏中的策略设计的?

[复制链接]

1万

主题

1万

帖子

3万

积分

论坛元老

Rank: 8Rank: 8

积分
36572
发表于 2020-2-13 09:47:22 | 显示全部楼层 |阅读模式
微信图片_20200213092940.jpg

任何游戏都有策略因素,而策略在游戏中的重要程度会根据游戏类型的不同也有所不同。

具体的游戏类型中的策略偏好和比重在这里不做过多说明,只稍微提一下:可以预见的是《炉石传说》这类TCG游戏及《文明》这样的模拟经营游戏中,策略是占到绝对比重的;但也不要认为MOBA、射击游戏甚至是格斗游戏中策略就很弱了,《任天堂全明星大乱斗》中,击飞值替代了血量的设定及不强调搓招而是强调防御、投技、重击和轻击构成了另外一个层面的石头剪刀布,使得大乱斗作为格斗游戏同样有着丰富的策略性。而在考虑到玩家的操作和反应之后,其将会变得更为有趣。

博弈论本身是经济学的一个分支,但是不要认为经济学的东西只能用于MMO中的经济系统的构建,而博弈论最为有趣的地方在于将人们的行为和目的量化成数学模型并以数学的方式分析。

博弈论本身是一门很深入的学科(很多经济学家也靠博弈论的研究获得过诺贝尔奖),所以我这里只是简单的思考一下如何将博弈论用于游戏中的策略设计。

我将会从以下几点去试着从博弈论的角度去分析游戏中的策略设计:

  • 策略类型有几种?
  • 一个好的游戏中策略应该是怎么样的?
  • 玩家行为会对策略产生哪些影响?


1.策略类型有几种?

(1)严格优势策略

理论上策略是指所有参与者可以采取的行为,但是有些行为明显是没有意义的,举个例子,在石头剪刀布中,如果你知道对手会出剪刀,那么你的策略就是出石头,剪刀和布就不应该是你的策略。

在博弈论中,出石头对付剪刀的策略叫做严格优势策略。即采取该策略严格要比其他所有可采取的策略收益都要高。

1.jpg

石头剪刀布的策略收益

这张图可能很多人看过,很多国内的游戏公司的笔试题就有有关这张收益图的题目,一般是石头剪刀布的策略收益配上另外一张不均衡的策略收益,之后会问你两种类型有什么区别之类的。

图中,横排和竖排表示两名参与者的策略,ABC表示三种不同的策略,中间第一个收益表示横轴参与者的收益,如果1则表示收益为1,0和-1同理。第二个收益就表示纵轴参与者的受益了。

所以这张图就很好理解了,(1,-1)表示这个策略中,横轴参与者的策略是优势策略,纵轴是劣势策略,也就是所谓的参与者1的策略克制参与者2。

严格优势策略在游戏中的运用是很多的(手游中应该是最多的),因为直观好理解,也是最为简单的,常见的就是卡牌游戏中的属性/阵营克制,SLG中的兵种克制,大佬们应该用的比我好,就不多说了。

严谨的严格优势策略收益应该如下:

2.jpg

即两名参与者的策略都是:不论在任何情况下严格选择B,因为选择策略B的收益总是要比选择策略A要高。这其实也是著名的囚徒困境的收益图,感兴趣的同学可以自行多了解一下,这里就不过多解释了。

(2)随机混合策略

随机混合策略还是可以用石头剪刀布来举例子,我们只需要改掉一点就行了:即严格优势策略中,我们知道对手的策略,但在随机混合策略中,我们不知道对手确切的策略

3.jpg

还是看石头剪刀布的收益图,,如果我们不知道对手的收益,而对手的策略是完全随机从ABC中选择一个策略的话,那么我们的策略也是随机的在ABC中选择一个策略,且我们每种策略的选择概率是1/3。

我们的策略不是确定的某个策略,而是混合的几个策略的概率集合。

举例子的话,就类似网球比赛中正反手球的选择,或者是足球比赛中点球的选择。射手有可能踢左边或者右边,但因为点球往往速度很快,守门员需要随机选择一方提前扑救。当然实际情况中影响双方的策略因素会更多,不过如果考虑理想情况就是如此。

(3)弱优势策略

弱优势策略是指我们并不能达成最大的策略优势,往往是因为最大优势的策略并非纳什均衡策略,所以会在相对弱势一些的策略中达成纳什均衡,可以看下方这个例子。

4.jpg

在这个例子中,左上方四个格子的收益其实就是上面已经说过的囚徒困境中的收益图。但是我们会发现:尽管看起来双方都选择策略A能达到更高(2,2)的收益,要高于双方都选C(1,1)的收益,但是因为双方都选择A并非纳什均衡:选择如果已知对方选A,那么我选择B收益更高,所以最后双方会达成都选C(1,1)的纳什均衡,因为这样的收益要高于双方都选B,而且也是处于纳什均衡中。

这个策略模型会要复杂许多,一般我们会在一些强调策略(手游中很少有真正强调策略的游戏)或者我们认为比较好玩的游戏中看到这类策略模型,比如前面举到的大乱斗的例子,最后大家都倾向于使用平A或空A,或者是MOBA中,理论上我们直接推对方基地是最快取得胜利的方式,但是出于大家都懂的各种要素,最后会形成三路占线的模式,而且分路的形式也变得逐渐固定,这就是玩家们在游戏的过程中逐渐摸索出来、大家都认可的策略模式,但这并非严格优势策略,而是相对优势策略,或者叫弱优势策略。

2.一个好的游戏中策略应该是怎么样的?

什么是好的游戏很难说得清楚,但是我相信所有人都会认可一点:好的游戏应该是易上手难精通的。

不论是曾经被人吹爆,在国内有巨大人气的暴雪(可惜是曾经了),还是前几年在引爆了全球手游市场的supercell,亦或是游戏界的新宠吃鸡,他们都可以说有易上手而难精通的特点。

易上手难精通的游戏除了策略性还有操作和数值因素在里面,其他两者和三者间的平衡也很重要,不过这里仅就策略性去聊,如何打造一个易上手但难精通的游戏?

(1)如何让游戏易上手?

我们已经知道了三种策略类型,那么哪一种策略类型是最为简单的,很显而易见:严格优势策略

在MOBA中,我们都很快就会知道,高等级装备好的英雄在面对低等级装备差的英雄的时候是有着绝对优势的,在面对敌方英雄的追击的时候,躲进防御塔也是最好的策略——防御塔会攻击敌方玩家,在我方防御塔下队友也可以更快速和方便的进行支援。

皇室战争也是如此:新手期往往我们都很快会发现防守优势,从而更加倾向于采用防守反击的策略。而炉石稍有不同(因为炉石是一个进攻有利的游戏),但我们也很快会明白:费用更高的怪物和法术更加厉害,而取得胜利的最好办法也是通过随从站场取胜。吃鸡我们也很快也会明白:装备很重要、以及吃毒是严格劣势策略。

上面举的都是一些对抗游戏,但其实在PVE为主的游戏中你也可以发现这些游戏有着这样的策略设计,比如上个月刚上国内市场就取得了亮眼成绩的莉莉丝的剑与远征就有着很明确的阵营克制关系和同阵营阵容加成,很明确的就告诉了玩家你需要去凑同一阵营的阵容。并且如果有注意到的话,前期小额付费和活跃赠送的英雄都是光耀帝国的英雄,而应该是在第4-6大关中,敌人都恰好是被光耀帝国克制的蛮血部落阵营的英雄,对应小R及免费玩家的首周游戏时间,进一步强化了策略验证。

而剑与远征的原型,放置奇兵,不但没有同阵营阵容加成,关卡设计也没有剑与远征这么细节,所以被剑与远征后来居上也是有原因的。

5.jpg

从博弈论的角度来看,如果这是一个石头剪刀布的游戏,那么严格优势策略应该是这样的:

6.jpg

石头是横排玩家的严格优势策略,可以理解为横排玩家养成过石头这个策略,如果只考虑玩家自己的收益,横排玩家出石头的策略收益严格优于其他策略。不过如果按照该收益,实际情况中横排玩家并不会一直出石头,最终的纳什均衡是两名玩家的收益均等,我们后面会详细讲。

除了清晰直接之外,严格也是很重要的:如果你希望策略A严格比策略B要好,那么不能采取暧昧的策略设计。比如阵营克制其实就挺暧昧的,因为玩家并不确定敌人究竟会是哪一个阵营的,克制了对手固然很爽,但也会担忧是否需要准备多套阵容。

除此之外,另外一种情况也有可能,比如我们有如下两种技能设计:

7.jpg

理论上来说剑雨是要强于斩杀的,因为虽然是AOE,但敌人只要数量超过两名那么收益一定比斩杀高,还将附带额外的燃烧效果。

但是必须要注意,玩家并不会去计算收益,这也是为什么很多游戏会给技能等级和战斗力,因为这样才能直观的告诉玩家哪个技能更强,哪个技能更弱,但也很有可能玩家会因为得到了错误的信息而做出错误的判断(战斗力高不一定更强)。

而且对技能的一些包装也可能影响玩家的判断,通过名字,玩家可能直观的认为剑雨是AOE技能,而斩杀是斩杀技能;另外,技能也是附在角色身上的,角色本身的价值也将会影响玩家对技能的判断。

8.jpg

这样的两个技能,谁强谁弱就一目了然了,这也才是真正意义上的严格优势策略。

让玩家快速的掌握游戏的核心规则是很重要的,为此我们加入了严格优势策略,玩家可以很快的了解到这个游戏的一些基本规则,并且能快速的使用这种规则取得优势,这是十分重要的,这也是易上手的精华所在。

(2)如何让游戏难精通?

除了严格优势策略,弱优势策略和随机混合策略都可以为游戏带来难于精通的点:弱优势策略带来的是策略的深度,而随机混合策略则是一定的随机性。

如果用MOBA举例子,弱优势策略类似于双方都没有把握的时候都不会发起进攻或是互换资源,而随即混合策略则是类似于走位躲技能和试图命中的博弈;而用吃鸡举例子的话,弱优势策略就是没有把握的时候大家都倾向于卡在圈边,决赛圈尤其如此,而随机混合策略就是选择打资源多但人也多的区域,还是选择在资源少但人也少的地方苟活。

这里特别说明一下,刷圈和刷的装备不是随机混合策略,因为玩家不会在其中选择策略,对毒圈的反应和根据装备选择的打法才是策略。

这两个策略不像前面严格优势策略那么一目了然,游戏和游戏之间差距也会比较大,但是我们仍然可以用石头剪刀布来举例子,我们先假设这个游戏会进行很多轮,最后比较双方的得分,那么这时候石头已经并非横排玩家的严格优势策略了——因为竖排玩家只要一直出布就行了,这时候横排玩家的收益不是0而是-1了。

9.jpg

我们把横排玩家的收益改成上图,那么因为实际游戏中反馈并非及时的,最终横排玩家出石头的概率首先会变大,但接着因为竖排玩家出布则出剪刀,然后因为竖排玩家出石头而改为出布,达到一个均衡状态之后两人的策略仍然是随机混合状态,而游戏的最终均衡状态是两名玩家的收益相等。

因为我们是在一个随机混合策略中加入了严格优势策略,从而导致了严格优势策略变成了非纳什均衡策略——因为你的对手也知道你的石头更强,他们会想办法通过策略去抹平甚至是取得优势。

因而我们可以看到,在加入多轮博弈之后,策略也会因此变得更加丰富起来,前面所说的两名玩家进行多轮改良版石头剪刀布之后,策略就较原先变得丰富了许多。

但是随即混合策略的问题在于随机性比较强,玩家不一定能够对策略有很好的认知,而且赢了之后有可能会认为是运气使然(当然好处也是输了也可以认为是对方运气较好)。所以我更加倾向于在游戏中设置更多的弱优势策略

在原来的基础上我们可以更加进一步改进策略,比如我们给竖排玩家一个技能:如果你出布,你不会输,你的对手不会赢。那么,布是竖排玩家的弱优势策略——如果你的对手出了剪刀,则你出石头的收益更高,而同理如果你的对手出了剪刀,那么你应该出石头。但因为你出布总是不亏甚至是赚的,所以最终出布成为了这个博弈中,纯策略纳什均衡中,竖排玩家的弱优势策略(这里有点绕,但总之出布就对了)。

10.jpg

看起来似乎拥有这个技能的竖排玩家太无敌了,游戏变得不公平了,那我们可以沿用之前的思路,将游戏改成总共进行三轮,而这个技能只能使用一次,这样一来布就不是均衡的弱优势策略了,竖排玩家也可以放弃这个技能带来的优势,单纯采取心理战。

弱优势策略很难像严格优势策略那样去说明,因为严格优势策略基本就是策划设计的,而弱优势策略往往是玩家之间的博弈了,所以有人会问了,怎么去合理的设计这种玩家之间的博弈呢?

我将从下面这一点去说明。

(3)贯续博弈和行为树

前面已经看到了,除了严格优势策略外,即使是只在石头剪刀布这样简单的游戏中加入一点变化,整个博弈都变得复杂了起来。单纯的给玩家复杂的策略对体验并没有好处,玩家期待的是乱中有序,能够感受到自己很牛逼,这样的游戏才是有趣和快乐的,这一点其实宫崎老贼的魂系列游戏中体现的尤为淋漓尽致:魂like的精髓就是,看似很难,实则不难

但是这样的游戏往往很难设计:如果设计需要的策略太多,不要说玩家,可能连开发者自己都搞不清了,而太少或者是太简单了,就很容易玩穿了,所以一个常见的办法是设计贯续博弈。

所谓的贯续博弈用人话说就叫回合制。

嗯……话是这么说,但不要小看回合制,尤其是在如今手游的时代,玩家的游戏体验和时间都变得越来越碎片化,像模拟城市那样大块且整体的去思考是很难的,玩家很有可能失败几次之后也就换游戏了。

其实近几年的趋势都是在做减法,但减法并非去掉游戏内容(当然有的时候也会去掉),更多的时候是把信息或玩法条理的收纳起来,让玩家层层递进的去摸索和体验,而非一开始就把所有内容都铺在玩家面前。

现在的很多游戏已经在这么做了,最明显的就是玩法和功能会随着玩家的游戏进程而逐渐解锁。但很多游戏没有做到的一点就是,玩法和系统并非成一个整体,而是彼此独立,系统和系统之间没有环环相扣,没有产生1+1>2的效果,不过这里也不展开说明了。

而回合制,也就是所谓的贯续博弈,其实也就是给玩家很多次博弈,比如在吃鸡中,一开始毒圈很大,玩家可以在任意一个地区搜刮装备,碰到的敌人数量也有限,随着毒圈的缩小,玩家也逐渐进行策略的选择,尽管部分其他玩家这时候被淘汰了,但其实玩家密度却慢慢在变高,也就是说玩家需要考虑的决策也变多了。

另外一个要素就是玩家的信息也在逐渐变多,这也会导致玩家需要决策的地方变多。MOBA也是如此,DOTA中的关键装备,LOL中的关键技能,中立的关键资源(因为一开始玩家并动不了大龙或者肉山),都是随着游戏的进程慢慢浮现出来,这也就导致玩家的策略也在慢慢变多。

但是需要注意的是,如果把握得当,你可以使得整个游戏的策略性十分丰富,但是仍然必须要注意,在单轮博弈中不能给玩家太多选项,否则就过犹不及了。

而所谓的行为树,其实也就是分析贯续博弈中所有可能策略的图形,如果我们设计了一个贯续博弈,也可以用它来指导我们的设计。

11.jpg

这是一个最简单的贯续博弈,首先是A选择上方或者下方的策略,然后是B选择,分析的方法叫逆向分析法,即从最后一个子博弈看,上图中,如果有第二轮博弈,B会选择下方的策略,而因为B会选择下方的策略,所以A会选择下方的弱优势策略,因为2>0。

这样说可能稍微有点抽象,我们可以套入一个现有的情景,比如LOL中,你打赢了一波团,对方仅剩2人的情况下:

12.jpg

该图说明,带线牵制对A来说收益都是固定的,但因为对方是打大龙还是推高地,B的收益有所不同。而B的两个上方策略(抢大龙和守高地)会因为一些情况而有所不同,所以其实是存在两个概率。

对于抢大龙:B大概率(0.8)会失败,此时收益是(7,-2),不但丢了大龙还要再牺牲一人;但有小概率(0.2)会成功,此时收益是(-5,10),对方不但错失推高的时机,还丢了大龙。下面的守高地则同理。

这里因为加入了概率事件,就不存在确定的策略了,是要选择舍命一搏还是稳稳地拿下大龙,都是有策略抉择在里面的。但我们通过逆向分析法可以知道,期望来说打大龙的收益是要比一波要高的,所以玩家会倾向于选择团灭对手之后打大龙。

但是这里要注意两个地方,第一,打大龙的收益要比推高地要高玩家才会选择大龙这个策略,否则如果这是一个至少相对劣势的策略,那么很有可能就变成一个无效策略了(所以LOL经常被人吐槽可以玩的英雄太少);第二,游戏设计者的思路不一定是玩家最终策略,比如有些策略设计者并不一定想到了,但是实际发挥出来很厉害,那么就出现了设计不可控的现象了。

从头到尾的设计也许会比较困难,但是从尾到头其实反而没那么难。有一个经典的博弈论模型是饥饿的狮子,感兴趣的同学可以去搜一搜。对于游戏策略的设计,其实跟行为树一样,我们可以先设计大体的框架和期望的方向,然后从尾巴开始(胜利条件),反推玩家每一步的博弈和整个游戏过程,这样或许可以更好的确保我们游戏的策略性。

说了这么多,总算是就着博弈论如何用于游戏策略简单的聊了聊。但其实影响游戏乐趣和策略性的东西还很多,举个例子:玩家就是其中重要的一环。如果盖亚理论,生命会极大的影响我们生存的环境,玩家也会改变游戏的生态。

玩家具体是怎么影响生态和策略的,可以看下这篇文章。作者深入浅出地从对抗游戏平衡性讲到了玩家如何影响游戏平衡。

好了,照惯例最后来总结一下:

对于一款策略性丰富的游戏,我们希望是易上手而难精通的,要达成易上手我们要有一定的很明确的严格优势策略;而为了让游戏难精通,我们又要有一定的随机性和弱优势均衡策略。这三者的平衡要把握好,其中随机性不宜太强,其他二者则考虑自己的目标用户吧。最后是我们不希望为难用户,所以我们尽量采用多轮依次贯续博弈的形式去铺开策略,让用户单次面临可以接受的策略选择。而设计策略的方法,我们可以从结果去反推,借鉴博弈论中行为树的形式去逆向设计。

以前看一本关于交互设计的书的时候,有两个观点很有意思,第一是为中级用户而设计,第二是把用户想成很忙但是很聪明的人

现在太多的游戏为初级和小白用户去设计了,刻意的去把游戏简化成失去了游戏本来的乐趣。其实我还挺认同这两点的:只有为中级用户去设计,用户才能找游戏(或者只是一款应用)中找到价值和成就感;而把用户当成很忙但是很聪明的人则意味着,不要担心用户学不学得会,去担心能不能在帮他省时间的前提下,给他创造价值。


作者:云飞
专栏地址:https://zhuanlan.zhihu.com/p/104775323

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

作品发布|文章投稿|广告合作|关于本站|游戏开发论坛 ( 闽ICP备17032699号-3 )

GMT+8, 2024-3-29 16:25

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表