博弈论知识总结
博弈论概述:
1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设:
1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识
3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念
与预期
2、和博弈有关的变量:
博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)
等的信息。
完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别:
1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己
效用,研究工具是无差异曲线。可表示为:maxU(P,I),其中P为市场价格,I为消费者可支配收入。
2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定
下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈
战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
1,2,...,n}1、参与人集合 ??{:
2、每位参与人非空的战略集 Si
n,...,3、每位参与人定义在战略组合 ? i? 1 s i ? ( s 1 ,..., s i s n )上的效用函数Ui(s1,s2,…,sn).
扩展式博弈:是博弈问题的一种规范性描述。
与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。
包含要素:
1,2,...,n}1、 参与人集合 ??{
2、 参与人的行动顺序,即每个参与人在何时行动;
3、 序列结构:每个参与人行动时面临的决策问题,包括参与人行动时可供选择的
行动方案、所了解的信息; 4、 参与人的支付函数。 比较:
1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。
5、博弈论分类:
按决策主体的行为相互作用时,当事人能否达成一个具有约束力的协议可分为:
1、合作博弈(强调团体理性、团体最优决策、效率) 2、非合作博弈(强调个人理性,个人最优决策) 按参与人行动先后顺序可分为:
1、 静态博弈:博弈中参与人同时行动,或者虽然不是同时行动,但是在行动前不知
道其他参与人所选择的行动。
2、 动态博弈:参与人的行动有先后顺序,后行动者获得先行动者的行动信息。 按参与人对信息的掌握程度可分为:
1、 完全信息:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的
了解,博弈开始时不存在不确定性因素。
2、 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信
息,即存在着有关其他参与人的不确定性因素。 按决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。 静态 动态 完全信息 不完全信息 完全信息静态博弈 均衡:纳什均衡 不完全信息静态博弈 均衡:贝叶斯纳什均衡 完全信息动态博弈 均衡:子博弈精炼纳什均衡 不完全信息动态博弈 均衡:精炼贝叶斯纳什均衡
6、根据所学这四种博弈的特点对这四种博弈做一个对比分析: 类型 完全信息静态博弈 信息和行动特点 均衡 均衡类型 纯战略纳什均衡(PNE) 特别均衡 占优战略纳什均衡(DSE) 重复剔除的占有均衡(IFDE) 求解方法 箭头法 划线法 不断剔除劣战略(弱劣战略的剔除顺序会影响均衡结果 学过的例子 性质 每个参与人对其纳什均他所有参与人的衡 特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动相同。 Hotelling价格竞多重性和存争 在性 库诺特价格竞争 一般一个博弈中存在参与者有多个行动时可以先考虑能否剔除弱战略简化博弈 混合战略纳什均衡(MNE) 聚点均衡 支付最大化社会福利博弈 法 小偷-守卫博弈 支付等值法 完全信息动态博弈 在博弈开始之前子博弈参与人之间的信精炼纳息不存在不确定什均衡 性,但是参与人行动存在先后顺序。 在完全信息动态博弈中,为了表示参与人之间的信息掌握关系,引入了信息及的概念。 在博弈开始之前贝叶斯参与人之间的信纳什均息存在不确定性,衡 但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。 不确定是参与人的了性的不确定性 在博弈开始前参与人之间的信息存在不确定性,同时参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。 精炼贝叶斯纳什均衡 子博弈精炼纳什均衡 有限次重复博弈均衡 无限次重复博弈均衡(无名氏定理) 一般博弈 与纳什均衡的唯一性有关 与贴现因子有关 连锁店悖论 囚徒困境(冷酷战略) 无限期轮流讨价还价模型 斯坦科尔伯格寡头竞争 雇主与公会之间的竞争 逆向归纳法求解 1、 均衡结果是原博弈的Nash均衡; 2、 同时在每一个子博弈上构成Nash均衡 不完全信息静态博弈 贝叶斯纳什均衡 混合战略(不完全信息情况下纯战略均衡的极限) 一般贝叶斯均衡 对原混合战性别战 略加入少许不确定性因素,求极限。 1、均衡存在性 2、不确定性体现为类型的不确定性 Harsanyi转换 机制设计 不完全信息动态博弈 信号传递博弈 分离均衡 根据所得信息修正判断概率,根据混同均衡 收益最大化准分离均衡 决策 信号传递博弈 不完全信息重复博弈与声誉 Milgrom-Roberts垄断限价模型 不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。 二、四种博弈类型具体分述 1、完全信息静态博弈
1.1 完全信息静态博弈特点:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动相同。 1.2 完全信静态博弈相关概念: 以新产品开发博弈举例说明:
参与人:参与人1和2。 参与人的集合卡表示为:Γ={1,2,…n}.表示所有参与人的集合,在新产品开发博弈中为:Γ={1,2}
行动:开发、不开发。
Ai表示参与人行动的集合。新产品开发博弈中参与人的行动集合为A1=A2={a,b},其中a为开发,b为不开发。
a={a1,a2…an}表示参与人的行动组合。新产品开发博弈中为:A={(a,a),(a,b),(b,a),(b,b)} 战略:参与人的行动规则。
在博弈中的战略可以定义为从观测集到行动集的映射关系,即: Si:Xi—Ai。用Si={si}表示参与人所有战略的集合。
在n人博弈中,用S=(s1,s2,s3…,sn)表示 n个参与人的战略组合,它表示博弈中每个参与人采取战略si的一种博弈情形。
在完全信息静态博弈中,由于不存在决策时序上的差异,所有参与人在同一决策时点即博弈开始的那一时刻决策,因此,所有参与人面临的决策情形都只有一种,所以,参与人的战略集与行动集相同。
支付:是指参与人在博弈中的所得。一般情况下也是用效用函数来表示参与人在博弈中的所得。因此,参与人的支付就可表示为一种特定博弈情形下参与人得到的确定效用水平或期望效用水平。支付一般用ui(1,2,…,n)表示参与人i的支付(效用水平),支付组合u=(u1,u2,…un)表示参与人在特定博弈情形下所得到的支付,其中为参与人i的支付。因此,参与人 i=(i=1,2,…,n)的支付就可表示为:ui=ui(si,s-i).
信息:是参与人所具有的有关博弈的所有知识,如有关其它参与人行动或战略的知识、有关参与人支付的知识等等。在“新产品开发博弈”中,如果两个企业都知道市场需求,那么这样的博弈情形就是我们前面所提到的完全信息假设;如果两个企业中至少有一个不知道市场需求,那么这样的博弈情形就是我们前面所提到的不完全信息假设。
1.3 纯战略纳什均衡
纯战略:参与人在给定信息下只选择一种特定(或确定性)的战略 混合战略:混合战略解释了一个参与人对其他参与人所采取的行动的不确定性,它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略。
纯战略纳什均衡中包括:占有均衡、重复剔除劣战略均衡、一般纯战略纳什均衡等。
1、占优均衡 占优战略:参与人的最优战略si *与其他参与人的选择 s-i无关。无论其他参与人选择什么战略,参与人的最优战略总是唯一的,这样的最优战略称之为“占优战略”。
在n人博弈中,如果对于所有的其他参与人的选择s-i,si *都是参与人 i 的最优选择 u(s*,s)?u(s,s)则称si *为参与人的占优战略。 在n人博弈中,如果对所有参与人都存在占优战略si *,则占优战略组合si*=(s1 * si2*,…, sn *)称为占优战略均衡。如果所有参与人都有占优战略存在,那么占优战略均衡就是唯一的所有理性参与人可以预测到的博弈结果。
2、重复剔除劣战略
如果在一个博弈中,参与人不存在占优战略,但是参与人i存在两个战略,其中一 ui(si??,s?i)?ui(si?,s?i)个战略叫另一个战略的所得效用要大,则理性的参与人绝对不会选择战略。
ui(si??,s?i)?ui(si?,s?i)严格劣战略:
u(si??,s?i)?ui(si?,s?i)ii?iii?i弱劣战略:
若重复剔除过程一直可持续到只剩下唯一的战略组合,则该战略组合即为重复剔除的占优均衡,此时该博弈是重复剔除战略可解。
要点:再重复剔除过程中,如果每次剔除的是严格劣战略,均衡结果与剔除顺序无关;如果剔除的是弱劣战略,均衡结果可能与剔除顺序有关。 3、一般Nash均衡
Nash均衡是完全信息静态博弈的解的概念,在完全信息静态博弈中,构成Nash均衡的战略是不可剔除的,即不存在任何一个战略严格优于Nash均衡战略。
求解纳什均衡的方法
划线法、箭头法。 划线法:
1、考察参与人1的最优战略
2、用上述方法找出参与人2的最优战略 3、找出最优战略组合 箭头法:
1、 对于每个战略组合,检查是否有参与人会偏离这个战略组合 2、 直至找出没有参与人会偏离的战略组合
纯战略均衡反映函数:各博弈方选择的纯策略对其他博弈方纯策略的反应。
1.4 混合战略纳什均衡
混合战略:
1k
在博弈 G?{?;S1,...,Sn;u1,...,un}中,对任一参与人i,设Si={Si,…,Si},则参与人i的一个混合战略为定义在战略集Si上的一个概率分布δi={δi1,…, δik},其中δij
j j
(j=1,…,k)表示参与人i选择战略 表示参与人i选择战略Si的概率的概率,即δi
j
满足0≦δi≦1,其中概率之和为1。
支付:混合战略的支付为各种概率下收益的加权平均。 混合战略纳什均衡:
在博弈 G?{?;S1,...,Sn;u1,...,un}中,混合战略组合δi={δ1*,…, δn*}为一个Nash
**?i??,??i??i,有vi(?i*,??)?v(?,?均衡。 当且仅当 iii?i)。
混合战略Nash均衡的求解: 1. 支付最大化法; 2. 支付等值法;
混合战略均衡反映函数:在混合策略的范畴内,博弈方的决策是选择概率分布,因此,反应函数就是一方对另一方选择的概率分布的反应。 聚点均衡:在现实生活中,参与人可能使用某些被博弈模型抽象掉的信息来达到一个“聚点”均衡。这些信息可能与社会文化习惯、参与人过去博弈的历史有关。 不同均衡概念之间的关系:
占优均衡<重复剔除劣战略均衡<纯战略纳什均衡<混合战略纳什均衡 1.5 纳什均衡的多重性与存在性
存在性:每个有限战略式博弈(参与人与相应的战略集均为有限)必存在纳什均衡,这个均衡可能是纯战略纳什均衡,也可能是混合战略纳什均衡。
多重性:一个博弈可能有多个均衡,博弈论并没有一个一般的理论证明,哪一个纳什均衡结果一定能出现。