|
发表于 2013-2-21 16:17:08
|
显示全部楼层
看来 博弈论的一切观点确实是你们的短板

我们可以看出 矩阵的数据分布规则是相似的 两个人做出决策的前置条件都是相等的
懦夫博弈的解法是
假如存在一个概率q,司机乙以概率q选择转向,那么他选择向前的概率将是1-q。
而你选择不同策略的预期赢利就会是:
你选择转向的预期赢利:1×q+(-2)×(1-q)=3q-2;
你选择向前的预期赢利:2×q+(-4)×(1-q)=6q-4。
如果司机乙真的以概率q选择转向,那么意味着他不会始终重复地选择某个策略(纯策略)。而他不选择重复地选择某个策略的条件必须是你也不会重复地选择某个策略。
因此,他以概率q选择转向必然意味着在这样的情况下你不可能有合适的纯策略;换句话说,他也必须使你在你的两个策略之间随机选择。
那么,在什么情况下你会在两个策略之间进行随机选择呢?
那就只有一种情况:当你选择任何一个策略的预期赢利都完全相同的时候——因为这样你就无法选出哪个策略更优,就只有随机选择。也就是说,司机乙选择q,使得 3q-2=6q-4q*=2/31-q*=1/3 这样,司机乙以2/3的概率选择转向,以1/3的概率选择向前,就可以使你在两个策略之间无差异而无法采取纯策略(读者可计算,你选择转向的预期赢利将是0,选择向前的预期赢利也是0)。
由此,我们可以记下司机乙采取的混合策略:(2/3,1/3)。 反过来,司机乙对你的选择也有着概率判断,而为了保持这种判断信念的后果与信念本身一致,你也以一定概率(比如p)随机选择你得策略,且p需要满足使司机乙在他的两个策略之间没有差异。
此时他各策略的预期赢利为:
司机乙选择转向的预期赢利:1×p+(-2)×(1-p)=3p-2;
司机乙选择向前的预期赢利:2×p+(-4)×(1-p)=6p-4。
而你需要选择p的值,使3p-2=6p-4,可得到p*=2/3,1-p*=1/3。读者可计算,此时司机乙无论选转向还是选向前,其预期赢利皆为0。由此,我们可以记下你采取的混合策略(2/3,1/3)。 由于你以概率2/3选择转向,以1/3的概率选择向前,以及司机乙以概率2/3选择转向,以1/3的概率选择向前,刚好可以互为对彼此的最优反应,因此它是一个纳什均衡状态,称混合策略纳什均衡,可以记为{(2/3,1/3),(2/3,1/3)}。 |
|