混合策略纳什均衡
本章介绍各种混合策略纳什均衡的博弈。许多这类的问题需要读者去解决。有些混合策略的纳什均衡是显而易见的,如:投掷硬币(图3.8)。另一些就不那么直观了,如鹰鸽均衡(图3.10),但均衡可行性取决于问题的参数。例如,在鹰鸽博弈中,当鹰受伤的成本w增加时,玩鹰的可能性将下跌,当土地的价值v增加时,玩鹰的可能性也增加。但是,混合策略均衡在性别战中是不可信的,如图3.9, 因为它表明,一个博弈方的纳什战略并不依赖于两个纯策略均衡结果的偏好强度。 事实上,你之后将会知道这个混合策略均衡在演化动态(图12.17)中是不稳定的。
6.1 代数混合策略
这里有一个简单的方法来混合策略是代数混合策略。这种实例是非常程序化的,所以我将给出一个例子。读者将发现很容易进行推广。
假设Alice有一个策略集{L,R},使用混合策略ζ=αL+(1-α)R,Bob的策略集是{U,D},使用混合策略为
然后我们认为Alice的支付
正如图6.1表示Alice的复合彩票的支付。
我可以减少这种复合彩票到只有四种支付的简单彩票,(L,U),(L,D),
(R,U)和(R,D),概率分别是αβ,α(1-β),(1-α)β,(1-α)(1-β)。博弈方i的彩票支付是
图6.1.复合彩票的混合策略
1
想到另一种方式来定义混合策略的产量
Alice的策略组合
的支付为
6.2 狮子和羚羊
外出打猎的狮子看到远方有大羚羊和小羚羊无论是单独或联合,他们将会抓住任何他们追逐的猎物,无论是单独或联合。但是,如果
他们选择不同的羚羊追,没有需要分享,而如果他们追逐相同羚羊,每个将只获得一半的猎物而其他羚羊会逃跑。假设他们的决定是独立的,大羚羊的热量值为Cb,小羚羊的热量值为Cl,其中0 如果(BA,BA)是纯策略均衡,有必要假定Cb /2≥Cl,容易看出这个条件是足够的。因为Cb> Cl,,很容易知道(LA,LA)不是纳什均衡。为了找出混合策略纳什均衡,我们假定(BA,BA)不是纳什均衡,因此Cb<2 Cl。狮子使用BA策略的概率为α。那么另一只狮子使用BA的支付为 使用LA策略的支付是 根据两个等式,我们得出 对于这两只狮子,混合策略的支付等于混合策略中的其中一个的策略的支付,因此这个支付等于BA策略的支付,是 2 这很容易看出之前的分数大于1/2,因此它们应该采取混合策略。 我们也可以计算出使用LA策略的预期支付,这个结果与使用BA策略的支付一样。 6.3 专利竞赛 Rapoport 和Amaldoss (1997)建立了“专利竞赛”博弈,这个博弈是“弱”的博弈方将得到4,其中任何整数金额都可以项目投资,其回报为10。但是“强”的博弈方将得到5,两个博弈方都要接受指示,哪个博弈方对专利投入最多,那个人将得到10的回报,如果他们不分胜负,那么两个都不能得到回报10。很明显弱的博弈方有5个纯策略(投资0,1,2,3,4),强的博弈方可以从0,1,2,3,4,5中选择。博弈的支付在4.3节的矩阵(g)体现了。 通过连续消除严格劣策略,每个博弈方还剩下三个策略,然后当每一个博弈方分别采用概率(3/5,1/5,1/5)和(1/5,1/5,3/5)时,这个博弈有混合策略纳什均衡。,博弈方的预期支付是(4,10)。这实际上是这个博弈的唯一的纳什均衡,尽管很难显示出来。 6.4 网球策略 在网球比赛中,发球者可以发球给接受者的反手或正手。接受者可以预见球将从反手那边还是正手那边过来。接受者将更有可能准确地回球。另一方面,发球者 反手发球比正手发球更厉害。因而,接受者正确的预计反手发球的概率是60%,正确的预计正手发球的概率是90%。如果接受者错误的估计为正手发球,将得到回报为20%的时间,如果接受者错误的估计为反手发球,将得到回报为30%的时间。博弈的标准式如图所示,找出博弈的纳什均衡。 6.5 保护生态环境博弈 三家公司(1,2,3)使用湖水用于生产。每个公司都有两个纯策略:(策略 3 1)净化污水或转移污水到湖里(策略2)。 我们假设,如果零或一家公司转移其污水入湖,水仍然是纯净的,但如果两个或两个以上的企业 ,水是不纯的,每个企业都遭受的损失为3。净化的成本为1。 我们将展示纳什均衡是:(a)一家公司总是污染水,另两家总是净化,(b)所有的公司都污染,(c)每一家公司污染的概率净化的概率是2/3。 情况(a)和(b),的纯策略很显著。对于(c)和(d)的完全混合策略均衡,假定x,y,z是三家公司净化的概率,x,y,z>0。如果公司3净化,它的支付为-xy-x(1-y)-y(1-x)-4(1-x)(1-y)。 如果公司3污染,它的支付为-3x(1-y)-3y(1-x)-3(1-x)(1-y)。因为公司3采用混合策略,因此这两个支付要相等,经过简化后,我们得出(1-3x)(1-3y)=3xy。另外两家公司也同样,我们得到两个理想的答案。(e)情形,假定其中一家公司净化的概率是1,然后找出其他公司的完全混合策略。 (d)每一家公司 或者(e)一家公司净化,另两家公司污染的概率为 6.6 强烈的爱 一位母亲想要从财政上帮她的失业儿子,但她并不想增加他的苦恼, 因此,在他儿子还没找到工作期间,她宣布她可以帮助她的儿子。但是他儿子之所以找工作是因为不想依靠他母亲的支持,即使他在找工作,但是 他可能找不到工作。支付矩阵如下所示。从图中可以看出,没有纯策略纳什均衡。寻找唯一的混合策略均衡。 6.7 广告博弈 三家企业(博弈方1,2,3)在市场上投放三个项目,这些产品可以在早上或晚上的电视做广告。一家企业每天做一次广告。如果在同一时间超过一家企业做广告,他们的利润是0。 如果只有一个企业在早上做广告,它的利润是 1,如果一个企业在晚上做广告,其利润2。企业必须同时做出他们每天的广告的决定。 4 有一个均衡是,在其中一个企业总是选择上午做广告,另一个总是选择晚上做广告,第三家企业以任何概率选择早上。此外,这些是唯一的纳什均衡,其中至少有一个企业使用一个纯策略。看到这一点,首先,假设企业1选择纯策略M(上午)。如果企业2和3选择混合策略,然后其中一人能够获得好处通过转移到纯策略E(晚上)。看到这一点,让这个混合策略为:企业2是αM+(1-α)E,企业3是βM(1-β)E。当三家企业的纯策略是S1、S2 、S3时,博弈方i的支付函数为∏i(S1、S2 、S3)。然后企业2采用策略M的支付为 因为定义β>0,当选择α=0时,收益为最大。因此企业2应该选择纯策略E。这与企业1和2采用混合策略的假设想矛盾。 类似的观点认为,如果企业1采用纯策略E.。我们的结论是如果企业使用一个纯策略,至少其他两家公司之一将使用一个纯策略。该企业,它不会使用与企业1相同的纯策略,因为这会不会是一个最好的回应。因此,两家公司使用相反的纯策略,第三公司做什么不要紧。 现在我们整个分析,假设公司2使用一个纯策略,明确了相同的结果。然后,企业3也一样。这就证明了如果一家企业采取纯策略,两家企业至少有一家会采取纯策略,这总结了这部分的问题。 为了找出混合策略的均衡,设企业1,2,3在早上做广告的概率是x,y,z。预期回报为1的早上做广告是(1-y)(1-z),晚上是2yz。如果他们相等,企业1选择x是纳什均衡,但是相等意味着1-y-z-yz=0,或者y=(1-z)/(1+z)。企业2和3也一样做,等式是y=(1-z)/(1+z)和z=(1-x)/(1+x)。同时解答,我们得出x=y=z= ,把y=(1-z)/(1+z)代入x=(1-y)/(1+y),得 因而x=(1-x)/(1+x),这是一个简单的二次方程,唯一的根在0和1之间,也就是 。因而,这是纳什均衡。 5
混合策略纳什均衡



