混合策略纳什均衡

由天下分享时间：2025/2/21 6:37:53 加入收藏我要投稿点赞

混合策略纳什均衡

本章介绍各种混合策略纳什均衡的博弈。许多这类的问题需要读者去解决。有些混合策略的纳什均衡是显而易见的，如：投掷硬币（图3.8）。另一些就不那么直观了，如鹰鸽均衡（图3.10），但均衡可行性取决于问题的参数。例如，在鹰鸽博弈中，当鹰受伤的成本w增加时，玩鹰的可能性将下跌，当土地的价值v增加时，玩鹰的可能性也增加。但是，混合策略均衡在性别战中是不可信的，如图3.9，因为它表明，一个博弈方的纳什战略并不依赖于两个纯策略均衡结果的偏好强度。事实上，你之后将会知道这个混合策略均衡在演化动态（图12.17）中是不稳定的。

6.1 代数混合策略

这里有一个简单的方法来混合策略是代数混合策略。这种实例是非常程序化的，所以我将给出一个例子。读者将发现很容易进行推广。

假设Alice有一个策略集{L,R},使用混合策略ζ=αL+（1-α）R,Bob的策略集是{U,D},使用混合策略为

然后我们认为Alice的支付

正如图6.1表示Alice的复合彩票的支付。

我可以减少这种复合彩票到只有四种支付的简单彩票，（L,U）,（L,D）,

（R,U）和（R,D）,概率分别是αβ，α（1-β），（1-α）β，（1-α）（1-β）。博弈方i的彩票支付是

图6.1.复合彩票的混合策略

想到另一种方式来定义混合策略的产量

Alice的策略组合

的支付为

6.2 狮子和羚羊

外出打猎的狮子看到远方有大羚羊和小羚羊无论是单独或联合，他们将会抓住任何他们追逐的猎物，无论是单独或联合。但是，如果

他们选择不同的羚羊追，没有需要分享，而如果他们追逐相同羚羊，每个将只获得一半的猎物而其他羚羊会逃跑。假设他们的决定是独立的，大羚羊的热量值为Cb，小羚羊的热量值为Cl，其中0

如果（BA,BA）是纯策略均衡，有必要假定Cb /2≥Cl，容易看出这个条件是足够的。因为Cb> Cl，，很容易知道（LA,LA）不是纳什均衡。为了找出混合策略纳什均衡，我们假定（BA,BA）不是纳什均衡，因此Cb<2 Cl。狮子使用BA策略的概率为α。那么另一只狮子使用BA的支付为

使用LA策略的支付是

根据两个等式，我们得出

对于这两只狮子，混合策略的支付等于混合策略中的其中一个的策略的支付，因此这个支付等于BA策略的支付，是

这很容易看出之前的分数大于1/2，因此它们应该采取混合策略。我们也可以计算出使用LA策略的预期支付，这个结果与使用BA策略的支付一样。

6.3 专利竞赛

Rapoport 和Amaldoss (1997)建立了“专利竞赛”博弈，这个博弈是“弱”的博弈方将得到4，其中任何整数金额都可以项目投资，其回报为10。但是“强”的博弈方将得到5，两个博弈方都要接受指示，哪个博弈方对专利投入最多，那个人将得到10的回报，如果他们不分胜负，那么两个都不能得到回报10。很明显弱的博弈方有5个纯策略（投资0，1，2，3，4），强的博弈方可以从0，1，2，3，4，5中选择。博弈的支付在4.3节的矩阵（g）体现了。

通过连续消除严格劣策略，每个博弈方还剩下三个策略，然后当每一个博弈方分别采用概率（3/5，1/5，1/5）和（1/5，1/5，3/5）时，这个博弈有混合策略纳什均衡。，博弈方的预期支付是（4，10）。这实际上是这个博弈的唯一的纳什均衡，尽管很难显示出来。

6.4 网球策略

在网球比赛中，发球者可以发球给接受者的反手或正手。接受者可以预见球将从反手那边还是正手那边过来。接受者将更有可能准确地回球。另一方面，发球者

反手发球比正手发球更厉害。因而，接受者正确的预计反手发球的概率是60%，正确的预计正手发球的概率是90%。如果接受者错误的估计为正手发球，将得到回报为20%的时间，如果接受者错误的估计为反手发球，将得到回报为30%的时间。博弈的标准式如图所示，找出博弈的纳什均衡。

6.5 保护生态环境博弈

三家公司（1，2，3）使用湖水用于生产。每个公司都有两个纯策略：（策略

1）净化污水或转移污水到湖里（策略2）。我们假设，如果零或一家公司转移其污水入湖，水仍然是纯净的，但如果两个或两个以上的企业，水是不纯的，每个企业都遭受的损失为3。净化的成本为1。

我们将展示纳什均衡是：（a）一家公司总是污染水，另两家总是净化，（b）所有的公司都污染，（c）每一家公司污染的概率净化的概率是2/3。

情况（a）和（b），的纯策略很显著。对于（c）和（d）的完全混合策略均衡，假定x，y，z是三家公司净化的概率，x，y，z>0。如果公司3净化，它的支付为-xy-x（1-y）-y（1-x）-4(1-x)(1-y)。

如果公司3污染，它的支付为-3x（1-y）-3y（1-x）-3(1-x)(1-y)。因为公司3采用混合策略，因此这两个支付要相等，经过简化后，我们得出（1-3x）（1-3y）=3xy。另外两家公司也同样，我们得到两个理想的答案。（e）情形，假定其中一家公司净化的概率是1，然后找出其他公司的完全混合策略。

（d）每一家公司

或者（e）一家公司净化，另两家公司污染的概率为

6.6 强烈的爱

一位母亲想要从财政上帮她的失业儿子，但她并不想增加他的苦恼，因此，在他儿子还没找到工作期间，她宣布她可以帮助她的儿子。但是他儿子之所以找工作是因为不想依靠他母亲的支持，即使他在找工作，但是

他可能找不到工作。支付矩阵如下所示。从图中可以看出，没有纯策略纳什均衡。寻找唯一的混合策略均衡。

6.7 广告博弈

三家企业（博弈方1，2，3）在市场上投放三个项目，这些产品可以在早上或晚上的电视做广告。一家企业每天做一次广告。如果在同一时间超过一家企业做广告，他们的利润是0。如果只有一个企业在早上做广告，它的利润是 1，如果一个企业在晚上做广告，其利润2。企业必须同时做出他们每天的广告的决定。

有一个均衡是，在其中一个企业总是选择上午做广告，另一个总是选择晚上做广告，第三家企业以任何概率选择早上。此外，这些是唯一的纳什均衡，其中至少有一个企业使用一个纯策略。看到这一点，首先，假设企业1选择纯策略M（上午）。如果企业2和3选择混合策略，然后其中一人能够获得好处通过转移到纯策略E（晚上）。看到这一点，让这个混合策略为：企业2是αM+（1-α）E,企业3是βM（1-β）E。当三家企业的纯策略是S1、S2 、S3时，博弈方i的支付函数为∏i（S1、S2 、S3）。然后企业2采用策略M的支付为

因为定义β>0，当选择α=0时，收益为最大。因此企业2应该选择纯策略E。这与企业1和2采用混合策略的假设想矛盾。

类似的观点认为，如果企业1采用纯策略E.。我们的结论是如果企业使用一个纯策略，至少其他两家公司之一将使用一个纯策略。该企业，它不会使用与企业1相同的纯策略，因为这会不会是一个最好的回应。因此，两家公司使用相反的纯策略，第三公司做什么不要紧。

现在我们整个分析，假设公司2使用一个纯策略，明确了相同的结果。然后，企业3也一样。这就证明了如果一家企业采取纯策略，两家企业至少有一家会采取纯策略，这总结了这部分的问题。

为了找出混合策略的均衡，设企业1，2，3在早上做广告的概率是x，y，z。预期回报为1的早上做广告是（1-y）（1-z），晚上是2yz。如果他们相等，企业1选择x是纳什均衡，但是相等意味着1-y-z-yz=0，或者y=（1-z）/（1+z）。企业2和3也一样做，等式是y=（1-z）/（1+z）和z=（1-x）/（1+x）。同时解答，我们得出x=y=z=

，把y=（1-z）/（1+z）代入x=（1-y）/（1+y），得

因而x=（1-x）/（1+x），这是一个简单的二次方程，唯一的根在0和1之间，也就是

。因而，这是纳什均衡。