好文档 - 专业文书写作范文服务资料分享网站

阅读博弈论类书籍的心得体会

天下 分享 时间: 加入收藏 我要投稿 点赞

阅读博弈论类书籍的心得体会

图书情报 宋静思

最近阅读的书目主要围绕在博弈论领域,由浅入深的从博弈论平话类书籍到博弈论的理论应用类书籍都有一些涉猎。近一个月来我所阅读的书目主要有王则柯的《新编博弈论平话》、高志明的《生存博弈》、黄涛的《博弈论教程—理论、应用》以及张维迎的《博弈论与信息经济学》。由于个人能力与知识储备的限制,对以上书目的认识理解和心得也是有限的,下面我仅对上述书目中能够引起我思考的一些理论和案例展开分析并阐述我的一点见解,以及提出我所认为的这些博弈理论可以分析的社会现象。

一、对博弈论平话类书籍的心得

首先从王则柯教授的《新编博弈论平话》和高志明教授的《生存博弈》这两本书使我我深刻的认识到博弈论作为一种科学的思维方法对我们在日常生活中科学的做出决策有重大的意义。它们都是以比较浅显的例子和故事普及博弈论的一些知识和方法,阐发博弈论的一些思想和观念。从囚徒困境、情侣博弈、诺曼底登陆模拟和慕尼黑谈判模拟等能够引起读者兴趣的故事入手,介绍静态博弈、动态博弈、纳什均衡、零和博弈、双赢对局、帕累托优势、子博弈精炼纳什均衡等博弈论的基本概念,以及劣势策略消去法、相对优势策略下划线法、确定混合策略纳什均衡的反应函数法、动态博弈的倒推法等博弈论基本方法,在以上两本书的论述中很少使用到高等数学的知识,这两本书是使我对博弈论产生兴趣的启蒙老师,帮助我了解博弈论的若干初步知识。

从最初对这两本书的阅读我真正理解了什么是博弈决策,就拿我们生活中报考什么学校、从事什么职业、选择何种方式度过周末闲暇时光等这些例子来说,之所以称之为博弈决策,是因为在这些例子当中,我的身边往往存在和我情形相似的决策者,我们的思维和行动相互之间产生着很微妙的互动影响。博弈论研究的目的,就是要清晰地揭示蕴涵于这种互动影响中的基本概念和原理,从而帮助我们建立策略思维的意识。

看过囚徒困境后,我明白了为什么寡头企业不选择在市场上结盟而是竞相采取低价策略企图抢占更多的市场份额;又为什么多数情形是非合作博弈。虽然通过囚徒困境的博弈分析我可以理解上述现象产生的原因,然而究其根本原因,是什么导致了囚徒困境呢?这不禁引发了我的思考。设想如果两个罪犯充分相信同伙遵守最初的约定死咬着抵赖会有最后的困境出现么?如果联盟内部成员相信彼此遵守约定会不会是共赢的结局呢?所以我认为产生囚徒困境这一结果的主要原因是社会中诚信的缺失。由于经济学中理性主体的假设,经济主体即参与人都是以自身利益最大化为目标,因此在市场自由交换过程中资源的有限性和人们欲望的无限性之间的矛盾迫使人们在追求最优化过程中竞争、协作与交易。在合作过程中,又由于社会诚信的缺失人们经常采取投机取巧和搭便车行为,损人不利已,产生“囚徒困境”。基于这一均衡结果我认为除了加强社会诚信建设以外还有一些博弈论领域所研究的方法可以改变囚徒困境这一均衡结果。具体方法将在下文中对张维迎教授《博弈论与信息经济学》的心得体会中提到。

在看智猪博弈后,我明白了为什么现在大企业会积极主动去技术创新,而中小企业只需要坐等技术创新后的利益。在企业中,大企业就好比大猪,中小企业就好比是小猪。控制按钮可以比作技术创新,可以给企业带来收益。大企业资金雄厚,生产力大有更多的能力进行技术创新推出新产品后可以迅速占领市场获得高额利润。而小企业的最优选择就是等待,等大企业技术创新后跟在大企业后抢占市场份额从这种创新中获得利益。而且这样小企业所获得的利益比自己主动技术创新所获得的利益要大。所以我明白了为什么有的企业会不重视技术创新因为他们是市场中的小猪。所以说创新不是每个企业都要重视和加大投入的方面。 《博弈论平话》和《生存博弈》这两本书带给我的最大收获是点燃我对博弈论的兴趣,让我意识到博弈时时存在,它就在我们身边。正是因为这两本书的引导才使我产生继续深入学习博弈论理论的动力,进而阅读《博弈论基础教程》和《博弈论与信息经济学》。

二、对博弈论理论应用类书籍的心得

(一)完全信息静态博弈

1、基础知识简介

张维迎教授的《博弈论与信息经济学》和黄涛教授的《博弈论教程》的第一章节内容都是围绕完全信息静态博弈进行讲解的,下面将两本书结合起来介绍完全信息静态博弈中我学到的内容。

通过这一章节的学习我首先知道博弈的基本概念包括参与人、行动、信息、战略、支付(效用)、结果和均衡。参与人指的是一个博弈中的决策主体,他的目的是通过选择行动来最大化自己的支付水平。行动是参与人在博弈的某个时点的决策变量,与行动有关的一个重要问题是行动顺序,也正是基于行动顺序做出的关于静态博弈与动态博弈的区分,同时行动顺序的不同也可能产生不同的博弈结果。信息是参与人有关博弈的知识,特别是关于“自然”的选择、其他参与人的特征和行动的知识;在信息的概念体系下又引申出完美信息、完全信息和共同知识这几个与信息有关的概念。完美信息指一个参与人对其他参与人的行动选择有准了解的情况。即每一个信息集只包含一个值。完全信息是指自然不首先行动或者自然的初始行动被所有参与人准确观察到的情况,即没有事前的不确定性。共同知识指的是“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道.......”的知识。战略是参与人在给定信息及的情况下的行动规则。它规定参与人什么时候选择什么行动。支付是指一个特定的战略组合下参与人得到的确定的效用水平或者期望效用水平。支付往往是参与人最关心的东西。结果是博弈分析者所感兴趣的所有东西,如均衡战略组合,均衡行动组合,均衡支付组合等。均衡是所有参与人的最优战的组合。接下来学习到的是博弈的战略表述即标准式表述,在这个表述中所以参与人同时选择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。注意这里的“同时行动”是一个信息概念而并非日历上的时间概念,只要每个参与人选择自己行动的时候不知道其他参与人的选择,就说他们在同时行动。

在有博弈论的基本概念基础知识后才开始学习完全信息静态博弈的核心内容——纳什均衡。两本书都首先对纳什均衡的特殊情况进行了讨论,然后讨论纳什均衡的一般概念。通过“囚徒困境”中两个嫌疑犯的最优战略博弈的分析,引出占优战略均衡的概念。一个参与人的战略不依赖于其他参与人的战略选择,即无论让他参与人选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占有战略”。通过运用“重复剔除劣势战略”的思路在“智猪博弈”中大猪与

小猪的博弈过程中剔除小猪的劣势战略“按”进而形成新的博弈,最终找出这一博弈中的均衡,这个均衡被称为“重复剔除的占有均衡”。上面的“重复剔除劣势战略”的思路主要是首先找出某个参与人的劣势战略,把这个劣势战略剔除掉,重新构建一个不包含已经剔除战略的新战略;然后再剔除掉新战略中某个参与人的劣势战略;继续这个过程,一直到只剩下一个唯一的战略组合为止。然而,有很多博弈我们无法使用重复剔除劣势战略的办法找出均衡,为了找出那些博弈的均衡解而引出了纳什均衡的概念。“纳什均衡”是完全信息静态博弈解的一般概念,如果存在这样一个策略组合——给定该策略组合中其他参与者的选择,没有人有积极性改变自己的选择,我们就说该策略组合是一个纳什均衡。构成纳什均衡的战略一定是重复剔除严格劣势战略过程中不能剔除的战略,就是说没有任何一个战略严格优于纳什均衡战略;值得注意的是许多不存在占有战略均衡或者重复剔除的占有均衡的博弈,却存在纳什均衡。这三个概念之间关系如下:每一个占有战略均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一个纳什均衡都是占优战略均衡或者重复剔除的占优均衡;纳什均衡一定是在重复剔除严格劣势战略中没有被剔除掉的战略组合,但是没有被剔除掉的战略组合不一定是纳什均衡,除非他是唯一的。以上是关于纳什均衡的基本概念,作者又例举了库诺特寡头竞争模型、豪泰林价格竞争模型、公共地的悲剧、公共物品的私人自愿供给、中央政府和地方政府之间的基础设施建设博弈等经济学上的例子来说明纳什均衡在经济学上的应用,是我看到纳什均衡理论应用的广泛与实用性。

通过对社会福利博弈和猜谜游戏这两个例子的介绍,作者让我们发现有些博弈不存在纳什均衡,为了找出这些博弈的均衡结果作者又提出了一个新的概念——混合战略纳什均衡。混合战略指的是参与人以一定的概率选择某种战略,比如,参与人以0.3的概率选择第一种战略,以0.5的概率选择第二种战略,以0.2的概率选择第三种战略。为了区别起见,作者将原来的纳什均衡称作纯战略纳什均衡。如果一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动,称该战略为纯战略;如果一个战略规定参与人在给定信息情况下以某种概率分布随机的选择不同行动,我们称该战略为混合战略。作者通过监督博弈的例子来说明混合战略的求解过程,通过例子可以得出结论任何博弈都存在一个纳什均衡,如果没有纯战略纳什均衡存在,那么至少存在一个混合战略纳什均衡。

书中还介绍了“双人零和博弈”这一特殊的博弈局势,双人零和博弈中只有两个参与人参加而且支付之和总是为0,也就是说剧终人的利益总是完全对立的,一方的所得就是另一方的损失,因此也成为严格竞争博弈。求解双人零和博弈的方法主要用到的是极小极大原理。双人零和博弈的计算方法可以总计如下:如果矩阵A的元素中有小于等于0的,那么加上一个常数使他们都变得大于0,然后用两个对偶的线性规划即可解出纳什均衡。

在书中章节的最后两位作者都提到纳什均衡的存在性与多重性问题,张维迎教授运用数学方法证明了纳什均衡的存在性,即任意有限博弈至少存在一个纳什均衡(纯战略的或混合战略的)。由一个蛋糕分配的例子作者又提出了纳什均衡的多重性。假设两个人分一块儿蛋糕,每个人独立的提出自己要求的份额。设X为第一个人要求的份额,Y为第二个人要求的份额,按照X+Y≤1的要求进行分配,那么任何正好分割蛋糕的两个人的要求都是纳什均衡,即X+Y=1的任意X和Y都可以组成纳什均衡,因而这个博弈有无穷多个纳什均衡。这个例子也证明了纳什均衡的多重性,可以有一个,两个或者无穷多个纳什均衡。

以上便是我在这两本书中学习到的完全信息静态博弈的基础知识,下面我将就几个博弈类型写一点我个人的感受与思考。

2、浅谈心得体会

首先我想谈一下对公共用品供给问题在博弈论上的分析。如果一种资源没有排他性的所有权,作为一种公共用品存在不限制人们的使用,就会导致这种资源的过度使用,进而产生“公共地悲剧”。“公共地悲剧”这一现象的产生我认为是可以运用博弈论中的“囚徒困境”来加以分析,假使有两个参与人,每个参与人都对某一种资源有需求,并且是使用的越多参与人获得的效用越大,资源是有限的,如果过度使用会对资源造成损害进而影响参与人的长期利益时期远期效用减小,面对这一情况参与人A会想假如我节约使用资源参与人B过多的使用资源将会影响我下一期的效用,所以我这一期要尽可能多的使用资源,当然参与人B也会这样的思考A,因此最终出现了两个参与人都最大化的使用资源这一均衡结果进而出现了“公共地悲剧”。书中例举了草场放牧的例子来说明公共地悲剧的产生,那么我在思考这样的情况在信息资源也是作为一种资源存在的,会不会有这种情况出现呢?最初我的想法是不会,因为信息资源中的很多资源是可以复制

阅读博弈论类书籍的心得体会

阅读博弈论类书籍的心得体会图书情报宋静思最近阅读的书目主要围绕在博弈论领域,由浅入深的从博弈论平话类书籍到博弈论的理论应用类书籍都有一些涉猎。近一个月来我所阅读的书目主要有王则柯的《新编博弈论平话》、高志明的《生存博弈》、黄涛的《博弈论教程—理论、应用》以及张维迎的《博弈论与信息经济学》。由于个人能力与知识储备的限制,
推荐度:
点击下载文档文档为doc格式
7vwbo1pxym2p7v440mdr
领取福利

微信扫码领取福利

微信扫码分享