好文档 - 专业文书写作范文服务资料分享网站

1.完全信息静态博弈实验指南(2020)

天下 分享 时间: 加入收藏 我要投稿 点赞

西方经济学实验一:完全信息静态博弈实验指南

一、博弈论概述

1、博弈论的概念 博弈论(game theory)又被称为“对策论”、“赛局论”。博弈论是研究相互依赖、相互影响的决策主体的理性决策行为及这些决策的均衡结果的理论。

2、博弈的构成要素 博弈主要包括局中人、行动、信息、战略、支付(效用)、结果和均衡等要素,其中,局中人、战略和支付是描述一个博弈所需的最少要素。局中人、行动和结果统称为“博弈规则”。

3、博弈的分类 (1)依据博弈参与者相互作用时能否达成一个具有约束力的协议,可将博弈分为合作博弈和非合作博弈。如果有具有约束力的协议,就是合作博弈;如果没有,就是非合作博弈。

(2)依据博弈局中人行为的时间序列性,可将博弈分为静态博弈、动态博弈两类。静态博弈是指在博弈中,局中人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,局中人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

(3)按照局中人对其他局中人的了解程度,可将博弈分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中,每位局中人对其他局中人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果局中人对其他局中人的特征、策略空间及收益函数信息了解得不够准确,或者不是对所有局中人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。

目前经济学家们所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博理论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈可分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,其对应的均衡概念和理论研究的代表人物如表1所示。

表1非合作博弈分类及对应的均衡概念 行动次序 信息 完全信息 不完全信息

纳什均衡 代表人物:纳什(1950,1951) 贝叶斯均衡 代表人物:海萨尼(1967-1968) 子博弈精练纳什均衡 代表人物:泽尔腾(1965) 精炼贝叶斯均衡 代表人物:泽尔腾(1965) 静态 动态 4、几种典型的博弈均衡 (1)纳什均衡 纳什均衡 (Nash equilibrium)的核心思想是:博弈的理想结局是,每个局中人选择的策略是对其他局中人所选策略的最佳反应,其中每一个局中人都不能因单方面改变自己的策略而获益。

纳什均衡有一个很重要的特点,是可以自我实施的,即信念和选择之间的一致性。就是说,基于信念的选择是合理的,同时支持这个选择的信念也是正确的。如果所有人都认为这个结果会出现,这个结果就真的会出现。

如果局中人事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。(R2,C2) 2

局中人C

C1 局中人R R1 R2 R3 100,100 50,0 0,300 0,0 1,1 0,0 C2 50,101 60,0 C3 200,200 (2)混合战略纳什均衡 工人

偷懒 不偷懒

监督 1,-1 -1,2 老板

不监督 -2,3 2,2 员工不偷懒、老板不监督是最好的(总收益最大),但这不是一个纳什均衡。如果员工不偷懒,则老板不监督;但如果员工知道老板不监督,员工则偷懒;如果老板知道员工偷懒,老板则监督……形成一个循环。

假如老板认为员工偷懒的概率是P,不偷懒的概率是1-P,

从老板的角度看,监督的预期收益是: 1×P+(-1)×(1-P)=2P-1……(1) 不监督的预期收益为: (-2)×P+2×(1-P)=1-4P……(2) 令(1)=(2),得P=1/3,这时,员工选择以1/3的概率偷懒,2/3的概率不偷懒,老板监督与不监督,老板的收益一样的。

假如员工认为老板监督的概率为Q,不监督的概率为1-Q,

这时,从员工的角度,偷懒的预期收益是: (-1)×Q+3×(1-Q)=3-4Q……(3)

不偷懒的预期收益为: 2×Q+2×(1-Q)=2……(4)

要使员工的选择在这两者之间无差异,则令(3)=(4),得Q=1/4;意味着老板以1/4的概率监督,3/4的概率不监督,员工的的收益一样的。

因此,混合战略纳什均衡是:员工以1/3的概率偷懒,2/3的概率不偷懒;老板以1/4的概率监督,3/4的概率不监督。

***纳什均衡的存在性问题:(一般存在奇数个纳什均衡)

1、每一个有限博弈至少存在一个纳什均衡(纯战略或混合战略);

2、如果一个博弈存在两个纯战略纳什均衡,那么,一定存在第三个混合战略纳什均衡。 (3)高风险下的纳什均衡 在一些特殊情况下,即使犯错误的可能性很小也可能导致大的灾难(比如核电站,出问题就非常严重),纳什均衡就可能不会产生有说服力的解释。考虑如下博弈:

乙 左 右 上 8,10 -1000,9 甲

下 7,6 6,5 在这个博弈中,局中人甲会选择“下”,因为如果乙不小心(低概率)犯错误,要避免产生右上的灾难性情况。 这个例子说明,个体可能不想我们所假设的那样完全理性,在遇到高风险的情况下,人们会考虑风险,从而使得最终结果可能偏离纳什均衡战略。

(4)占优策略均衡 在一些特殊博弈中,一个局中人的最优策略选择可能并不依赖于其他局中人的策略选择,即无论其他局中人选择什么策略,他的最优策略是唯一的,这种最优策略被称为“占优策略”。该策略只要求行动者是理性的,对手是否理性不作要求。

在一个博弈里,如果所有局中人都有占优策略存在,那么占优策略均衡是可以预测到的唯一的均衡,因为没有一个理性的局中人会选择劣策略。

(5)重复剔除占优均衡 “劣”战略:无论对方选择什么,如果自己选择A得到的收益总是小于选择B得到的收益,A就是相对于B的劣战略。把这个劣战略剔除;然后再剔除剩下的博弈中对手的劣战略;继续这个过程,直到没有劣战略存在。如果剩下

2

的战略组合是唯一的,这个唯一的战略组合就是“重复剔除占优均衡”。

最初的智猪博弈收益矩阵

首先剔除小猪行动劣策略所得的收

益矩阵为:

其次,再剔除了大猪等待劣策略的

智猪博弈均衡

小猪 小猪

行动 行动 等待 行动 等待 行动 (5,1) (4,4) 行动 (4,4) 行动 (4,4) 大猪 大猪 大猪

等待 (9,-1) (0,0) 等待 (0,0) 等待

理性共识:

0阶理性共识:每个人都是理性的,但不知道其他人是否是理性的;

1阶理性共识:每个人是理性的,并且知道其他每个人也都是理性的,但并不知道其他人是否知道自己是理性的;

2阶理性共识:每个人是理性的,并且知道其他每个人也都是理性的,并且知道其他人知道自己是理性的,但不知道其他人是否知道自己知道其他人都是理性的……三阶、四阶……n阶依次类推。

重复剔除不仅要求每个人是理性的,而且要求每个人知道其他人都是理性的,每个人知道每个人知道每个人是理性的,如此等等,即理性是“共识”。

小猪

等待 5、经典博弈分析 (1)囚徒困境: 假定有两个犯罪嫌疑人共同作案。警察抓住他们以后,分开拘押,并告诉他们:可以选择坦白,或是不坦白;如果一个人坦白,而另一个人不坦白,则坦白的一方会被立即释放,而不坦白的一方被判10年;如果两人都坦白,则会每人各判8年;如果两人都抵赖,因证据不足,则每人在关押1年后释放。那么,这两个犯罪嫌疑人该如何选择呢?该博弈体现了哪种均衡?

坦白 不坦白 坦白 (-8,-8) (0.-10) 甲

不坦白 (-10,0) (-1,-1)

我们假设局中人是理性的,都不想坐牢,能少坐牢尽量少坐牢。我们先考虑甲的选择,他面对的问题是:如果乙坦白的话,自己坦白判8年,不坦白判10年,那么坦白比不坦白好;如果乙不坦白,自己坦白会被立即释放,不坦白则判1年,坦白还是比不坦白好。因此,不论对方坦白不坦白,甲或乙自己的最优选择都是坦白。由囚徒困境我们可以看出,一个人的最优选择并不依赖于他人的选择,因此囚徒困境博弈有占优均衡,所以其结果很容易预测。

(2)智猪博弈 假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,谁先按按钮,谁会后到食槽边。而且按按钮的那一方就少吃2个单位的食物(按按钮的成本),若大猪按按钮,那么小猪先到槽边,大小猪吃到食物的收益比是4∶4,如果两只猪同时按按钮,它们同时到槽边,大小猪吃到的食物比是5∶1;如果小猪按按钮,那么大猪先到槽边,大小猪吃到的食物比是9∶-1;当然如果两只猪都选择等待,那么没有食物进入食槽,两只猪的收益比就为0:0。

小猪

行动 等待

行动 (5,1) (4,4) 大猪 等待 (9,-1) (0,0) 综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。大猪明知小猪不会去踩踏板,但是去踩踏板总比不踩强,所以只好选择行动了。因此,小猪等待大猪行动是唯一的纳什均衡结果。 2

(3)混合战略纳什均衡 足球队的点球手走向罚球点时需要做一个重要决策:踢向网的左边还是右边(为了简单起见,忽略踢向中间或高球或低平球的选项)。守门员将力图预测点球手的行为,决定扑向左边还是右边。如果他扑向了罚点球的方向,那他很有可能将球扑出;如果他扑错了方向,那点球手就很可能取得进球。再次地,为了简单起见,假定守门员扑的方向正确就一定能扑出点球,不正确就会失球。相应的支付矩阵:

守门员

左 右 左 (-1,1)点球被扑出 (1,-1)点球被踢进 点球手

右 (1,-1)点球被踢进 (-1,1)点球被扑出

显然,上表4个策略组合都不会是均衡:给定一方的选择,另一方有激励改变他的选择。这是一种混合战略(mixed strategy),是指根据预先决定的概率随机选择不同的行动。混合战略的实质如下:你应该在每次罚点球前私下地通过抛硬币来决定你罚点球的方向。正面朝上就踢向右边,反面朝上就踢向左边;或者反之。

如果某个局中人有n个纯战略,那么,混合战略就是在这n个纯战略上的概率分布 (p1,p2,...,pn),即以 pi的概率选择纯战略i,

?pi?1ni?1。若pi=0,则说明纯战略i被选到的概率为0。

性质1:给定对手的均衡混合战略,每个局中人的均衡混合战略中以正概率选择的纯战略对该局中人是一样好的(或者称为无差异,indifferent)。

原因在于,如果某个纯战略严格地好于其他纯战略,那么,该局中人应该以1的概率选择那个纯战略,而这与混合战略纳什均衡是矛盾的。

性质2:给定对手的均衡混合战略,每个局中人的均衡混合战略中以正概率选择的纯战略不会比以0概率选择的纯战略差。

原因在于,如果局中人的均衡混合战略中以正概率选择的纯战略比以0概率选择的纯战略差,那么,该局中人的那个所谓均衡混合战略就不是他的最优选择,这与混合战略纳什均衡矛盾。

结论性评述 (1)以上罚点球中的博弈论分析说明,罚丢点球很正常,除非点球手将每个点球都罚到守门员够不到的死角。 (2)梅西罚丢点球应该得到原谅! (3)博弈论的主旨是换位思考。

二、实验目的

通过完全信息静态博弈实验,使学生直接参与博弈游戏并亲身感受“囚徒困境”,从而让学生进一步理解博弈论中的占优战略、纳什均衡等有关概念,并能够应用这些概念分析完全信息静态博弈问题。

三、实验过程

(一)实验准备 1、实验材料(扑克牌)一副,用作标记实验参与者身份及编号;

2、每位实验参与者有1份“完全信息静态博弈实验者收益记录表”,8轮均有“完全信息静态博弈决策(第X轮)”; 3、工作人员填写“完全信息静态博弈实验记录表”、“完全信息静态博弈实验数据汇总表”、“完全信息静态博弈实验全班收益汇总表”。

(二)实验人员分组 1、抽取4-5人为试验工作人员,保证全班按照偶数原则落实实验参与者。

2

2、按红、黑扑克牌颜色将实验者分为两组,编号分别为A1、A2、 ……An;编号分别为B1、B2、 ……Bn。A组坐教室一边,B组坐教室另一边,中间隔离,方便工作人员收发扑克牌。

3、按照特定牌落实工作人员。

(三)实验规则 1、在博弈过程中不允许合谋、欺诈欺骗等行为发生,出牌前不能让对方任何人看到自己的决策; 2、每个实验者都以追求最大收益为目标;

3、每位实验参与者在每轮博弈中仅可做出“红”或“黑”的选择。

4、本实验分两个阶段共8轮实验,每轮实验流程相同。首先,AB两组工作人员随机发牌,每位实验参与者需要确定自己的牌和身份编号。分发“完全信息静态博弈实验者收益记录表”,每位实验参与者填写相关信息。其次,AB两组工作人员分发“完全信息静态博弈决策”,每位实验参与者填写“完全信息静态博弈决策”,并在“完全信息静态博弈实验者收益记录表”中记录 “我的牌”、“我的编号”、“我的决策”。将填写好的“完全信息静态博弈决策”交给本组的工作人员。第三,AB组工作人员清点“完全信息静态博弈决策”无误后,交给统计人员。第四,AB组工作人员回收扑克牌,洗牌,等待“本轮实验结束,开始下一轮实验”指令。

5、教师公布配对博弈规则,工作人员记录每轮每对实验参与者的决策结果,填写每一轮的“完全信息静态博弈实验记录表”。记录完毕以后,向全体实验参与者宣读配对结果,全体实验参与者自行计算本轮个人收益,并将结果填入“完全信息静态博弈实验者收益记录表”。8轮实验结束后,实验参与者完成“完全信息静态博弈实验者收益记录表”,并交到各自组工作人员。AB组工作人员清点无误后,交给统计人员。

6、工作人员应及时汇总、计算实验数据,完成“完全信息静态博弈实验数据汇总表”和“完全信息静态博弈实验全班收益汇总表”,并予以发布。

4、工作人员须保存好A、B组工作人员移交上来的所有实验表格,以备汇总统计和查询之用。

5、实验参与者的收益为8轮实验个人收益总和。A、B组工作人员和统计人员收益数值为全班平均收益。 7、实验分为两个阶段,第一阶段进行1-4轮博弈, 收益计算如下: (1)两人同时出红牌,则两人都将获得5元收益; (2)两人同时出黑牌,则两人都将获得6元收益;

(3)两人出牌花色不同时,出红的同学获得11元收益,出黑的同学获得0元收益。

第二阶段共进行博弈5-8轮,收益计算如下: (1)两人同时出红牌,则两人都将获得5元收益; (2)两人同时出黑牌,则两人都将获得11元收益;

(3)两人出牌花色不同时 ,出红的同学获得16元收益,出黑的同学获得0元收益。

四、实验表格小样

(一)每位实验参与者填写 1、

完全信息静态博弈决策(第X轮)

姓名 我的牌 我的编号 我的决策 2、

姓名 轮次 第1轮 我的牌

完全信息静态博弈实验者收益记录表

班级 我的决策(黑或红) 对手的决策(黑或红)

我的收益 我的编号 2

1.完全信息静态博弈实验指南(2020)

西方经济学实验一:完全信息静态博弈实验指南一、博弈论概述1、博弈论的概念博弈论(gametheory)又被称为“对策论”、“赛局论”。博弈论是研究相互依赖、相互影响的决策主体的理性决策行为及这些决策的均衡结果的理论。2、博弈的构成要素博弈主要包括局中人、行动、信息、战略、支付(效用)、结果和均衡等要素,其中,局中人、战略和
推荐度:
点击下载文档文档为doc格式
1n5dy16vly5a66i6tmib553973044s010a2
领取福利

微信扫码领取福利

微信扫码分享