博弈论基础复习-11

1.描述双人策略型（标准型）博弈的基本结构及其纳什均衡。你是如何理解纳什均衡的？

（1）标准式博弈基本要素包括:局中人、策略、支付

（2）局中人：博弈的参与人

（3）纯策略：指局中人在博弈中可以选择采用的行动方案。每个局中人都有可供其选择的多种策略。

（4）支付（效用）：每个局中人从各种策略组合中获得的收益，由于它是参与人策略组合的函数，又称为支付函数

（5）Nash均衡假设有n个局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。

纳什均衡达成时，并不意味着博弈双方都处于不动的状态，在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态，囚徒困境就是一个例子。

2.分析两人两策略博弈构成囚徒困境博弈应满足的条件。囚徒困境博弈说明了什么问题？

条件：（1）T>R>P>S （2） 2R>T+S或2R>2P

囚徒困境反映个人最佳选择并非团体最佳选择，说明个人利益与社会利益的冲突。

3.描述双人策略型博弈的纯策略和混合策略。

（1）纯策略：指局中人在博弈中可以选择采用的行动方案。每个局中人都有可供其选择的多种策略，参与人i的纯策略si∈Si

参与人i的策略集（纯策略空间）为Si，i ∈I

策略组合：s= (s1, s2, „，si，„, sn)

策略组合空间：S＝i×Si （2）混合策略

混合策略：若参与人i有K个纯策略：Si＝｛si1，„，siKi1iK）称为iik

ik≤1，∑ ki(sik)是i选择sik的概率，ik＝1。对于所有的k＝1，2，„，K，0

纯策略为混合策略的一个特例。

4.简要分析扩展型博弈（博弈树）的构成要素。

博弈树的基本元素有：

（1）节点： x∈X，又称决策结，简称“结”

（2）枝：连结结点的连线

（3）信息集：一些节点的集合。在同一信息集中，局中人面临完全相同的决策形势。

（4）结：包括：

①初始结：博弈的起点。

②决策结：参与人采取行动的时点。

③终点结：博弈行动路径的终点。

6.理解完全信息动态博弈下的纯策略和行动。

行动与策略

（1）行动：是参与人在博弈的某个时点（某个信息集）的决策变量。行动组合：参与人的行动的有序集。

（2）策略：是参与人在给定信息集情况下的行动规则，它规定参与人在什么时候选择什么行动。

在静态博弈中，策略和行动是等价的。

在动态博弈中，策略在给定信息集下完整的行动方案，与行动是不同的。

7.什么是冷酷（触发）策略？谈谈你对重复博弈中冷酷策略的理解。

（1）触发策略：如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略。

12.比较合作博弈和非合作博弈。

（1）合约强制力不同

在合作博弈中，协议有外在力量保证强制执行；在非合作博弈中，协议没有外在力量保证强制执行。如囚徒困境博弈

（2）研究重点不同：

非合作博弈的重点是个体，合作博弈研究的重点是群体，讨论何种联盟会形成，联盟中的成员如何分配。

（3）用非合作博弈的框架来研究合作博弈：

将达成合作的谈判过程和执行合作协议的强制过程纳入扩展式博弈中研究

1、博弈的分类及相关概念。

以决策者是否能进行信息沟通可将博弈分为非合作博弈与合作博弈

非合作博弈的分类从信息角度看，博弈可分为：

完全信息博弈：指局中人对于自己以及其他局中人的策略空间、支付等有完全的了解。

不完全信息博弈：指局中人至少有一方对自己以及其他局中人策略空间、支付等不完全了解。

从局中人行动的先后顺序看，博弈可分为：静态博弈：局中人同时选择行动；动态博弈：局中人的行动有先后顺序，且后行动者可以观察到先行动者的行动后再行动。不完全信息静态博弈&不完全信息动态博弈：

完全信息静态博弈：策略型博弈&完全信息动态博弈：扩展型博弈

策略型博弈

它是由三个部分组成，即局中人、策略和各种策略组合中所得到的利益。

纳什均衡

局中人單獨改變策略不會得到好處的對局即策略組合

混合策略

局中人的混合策略是其纯策略空间上的一种概率分布，表示局中人实际博弈时根据这种概率

分布在纯策略中随机选择加以实施。

博弈树

对于任何一种双人完备博弈，都可以用一个博弈树来描述，并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。

完美信息博弈

是指一次只有一个局中人在行动，而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。

子博弈

指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。

行为策略

是指每一个参与人在每一个信息集上随机的选择行动。

逆向归纳法

逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时，从最后一个子博弈开始逆推上。

冷酷策略

又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。

类型 :一般地，将一个参与人所拥有的所有私人信息称为他的类型。

信号博弈

是研究具有信息传递作用的信号机制的一般博弈模型，其基本特征是两个博弈方，分别称为信号发出方和信号接收方。

分离均衡

信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者以概率1选择不同的信号，接收者完全可以通过信号来准确判断出发送者的类型。

混同均衡

信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者选择了相同的信号，接收者无法从信号中得到新的信息，无法对先验信念进行修正。

联盟

设X={1,2,….,I}为局中人集合，则其中任意一非空子集S

特征函数

特征函数型博弈对每一种可能联盟给出相应的联盟总和收益，也就是给出了一种集合函数，称为特征函数。