|
发表于 2009-7-17 01:00:00
|
显示全部楼层
Re:一道武器强化题
从数学模型来看,这道题是典型的“随机控制问题”,或者说是“马尔可夫动态规划”(MDP)问题,但幸运的是,解答还算比较简单
这个问题,具有所谓的“最优子结构”,所以可以用“动态规划”的方法求解,可以参看鼎鼎有名的《算法导论》里第15章关于动态规划里的论述,那里的装配线调度问题和这里的问题实质上是神似的.
下面考虑都是平均花费
简单的说,就是为了从17级最经济的升到18级(记最经济的花费是V(17)),对于每种玩家的放宝石的策略,考虑17级升级时的两种可能,一种是直接升到18,另一种是降到12级,但我们只考虑从12级最经济升到18级的花费,记为V(12),那么根据著名的Bellman方程,有V(17)=min(f,f+q*V(12)),这里的最小值是玩家在17级时所有的放入辅助宝石策略空间里取的,f是该策略的总花费,q则是失败概率,这样的话,v(12),v(13),...,v(17)每个都可以写一个方程,它们组成一个6个未知数,6个方程的方程组,可以解出答案来,类似的可以一直算到V(11),v(10),...,v(0)
求解bellman方程,也有其他的数值方法,比如迭代不动点法
这类武器强化问题,其实是个马尔可夫链模型,直接根据转移矩阵P,可以算出从初始状态首次到达某状态的平均步数,我以前为我们自己游戏里的宝石加星算过每级所需的平均步数和平均耗费 |
|