第三章纳什均衡的扩展与精炼
1. 什么是完全信息和不完全信息?什么是完美信息和不完美信息?在海萨尼转换中,自然对局中人类型的确定都是有限的吗?举例说明。(见教材)
2. 什么是重复博弈中的策略? 什么是一个重复博弈中的子博弈? 什么是一个子博弈完美纳什均衡? (见教材)
3. 以下(虚线框中的)子博弈的划分是否正确?
答:两个扩展式中的子博弈划分均不正确,图1中的划分对同一信息集产生了分割,图2中的子博弈不是开始于单节信息集的决策结点。
4. 在双寡头古诺模型中, 设逆需求函数为p=a-Q,其中Q=q1+q2为市场总需求, 但a 有a H 和a L 两种可能的情况, 并且企业1知道a 究竟是a H 还是a L , 而企业2只知道a=aH 和a=aL 的概率分别是θ和1-θ,该信息是双方都知道的。双方的总成本函数分别是cq 1和cq 2。如果两企业同时选择产量, 双方的策略空间是什么?试计算出贝叶斯纳什均衡。
假设企业2的产量为q 2,企业1将选择q 1最大化利润函数
π1=q 1(a −q 1−q 2−c 1) (这里a 取a H 或a L )
由此得:
1
q 1H =(a H −q 2−c 1)
21
q 1L =(a L −q 2−c 1)
2
企业2将选择q 2最大化它的期望利润
E (π2) =θq 2(a H −q 1H −q 2−c 2) +(1−θ) q 2(a L −q 1L −q 2−c 2) 1
[θa H +(1−θ) a L −(θq 1H +(1−θ) q 1L ) −c 2]2
在均衡时,q 1,q 2应满足
由此得:q 2=
1⎧q =(a −q 2−c 1) 1⎪⎪2⎨
⎪q =1[θa +(1−θ) a −(θq +(1−θ) q ) −c ]2H L 1H 1L 2⎪2⎩
由此得:
企业1的策略为:
11*
q 1=(a −c ) −[θa H +(1−θ) a L +c 1−2c 2]H H 1
2611*
q 1(a L −c 1) −[θa H +(1−θ) a L +c 1−2c 2]L =
26企业2的策略为:
1q *=[θa H +(1−θ) a L +c 1−2c 2]2
3
**
因此博弈的贝叶斯纳什均衡是:当a=aH 时,企业1生产q 1H ;当a=aL 时,企业1生产q 1L ,
企业2生产q *2。
5. 在下面的静态贝叶斯博弈中, 求出所有的纯策略贝叶斯纳什均衡。
(1)自然决定收益情况是由博弈1给出,还是由博弈2给出,选择每一博弈的概率相等;(2)局中人1了解到自然选择了博弈1,还是选择了博弈2,但局中人2不知道;(3)局中人1选择行动T 或B ,同时局中人2选择行动L 或R ;(4)根据自然选择的博弈,两局中人得到相应的收益。
L T B
1,10,0
R 0,00,0
T B
L 0,00,0
R 0,02,2
博弈1
博弈2
自然选择了博弈1时,局中人1选择T ,自然选择了博弈2时,局中人1选择B 。局中人2的策略是根据期望收益最大的原则确定。
局中人2的选择策略L 的期望收益为0.5×1+0.5×0=0.5,选择策略R 的期望收益为0.5×0+0.5×2=1,因此局中人2会选择策略R 。
该博弈的纯策略贝叶斯纳什均衡为:自然选择博弈1时,局中人1选择T ,自然选择博弈2时,局中人1选择B ;局中人2会选择策略R 。
6. 在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-q1-q 2-q 3,这里q i 是企业i 的产量。每一企业生产的单位成本为常数c 。三企业决定各自产量的顺序如下:(1)企业1首先选择q 1≥0;(2)企业2和企业3观察到q 1,然后同时分别选择q 2和q 3。试解出该博弈的子博弈完
美纳什均衡。
答:该博弈分为两个阶段,第一阶段企业1选择产量q 1,第二阶段企业2和3观测到q 1后,他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。
(1)假设企业1已选定产量q 1,先进行第二阶段的计算。设企业2,3的利润函数分别为:
π2=(a −q 1−q 2−q 3) q 2−cq 2π3=(a −q 1−q 2−q 3) q 2−cq 3
由于两企业均要追求利润最大,故对以上两式分别求一阶条件:
∂π=a −q 1−2q 2−q 3−c =0∂q 2
∂π3
=a −q 1−q 2−2q 3−c =0∂q 3
(1)(2)
求解(1)、(2)组成的方程组有:
*
q *2=q 3=
a −q 1−c
3
(3)
(2)现进行第一阶段的博弈分析:对与企业1,其利润函数为;
π1=(a −q 1−q 2−q 3) q 1−cq 1
将(3)代入可得:
π1=
q 1(a −q 1−c )
3
(4)
式(4)对q 1求导:
∂π1
=a −2q 1−c =0∂q 1
解得:
*q 1=
*
此时,π1=
1
(a −c ) 2
(5)
1
(a −c ) 212
11*(a −c ) , q *(a −c ) 2=q 3=26
(3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡:
*
q 1=
7. 如果将如下的囚徒困境博弈重复进行无穷次,惩罚机制为触发策略,贴现因子为δ。试问
δ应满足什么条件,才存在子博弈完美纳什均衡?
乙
甲坦白不坦白
坦白4,45,0
不坦白0,51,1
由划线法求得该博弈的纯策略纳什均衡点为(不坦白, 不坦白) ,均衡结果为(1,1),采用触发策略,局中人i 的策略组合s 的最好反应支付φi (s ) =max P i (s −i , s i ) =5,Pi (s*)=4,P i (sc )=1。若存
s i ∈S i
φi (s *) −P i (s *) 5−41
==,即只有当贴现因子δ>1/4在子博弈完美纳什均衡,必须满足:δ≥
φi (s ) −P i (s ) 5−14
时,才存在子博弈完美纳什均衡。
2
8. 假设有一博弈G=[N,S,P],其中N={1,2},S1=[0,50],S2=[0,50],P 1(s ) =100s 1−10s 1+10s 1s 2,
P 2(s ) =200s 2−15s 22+10s 1s 2,i=1,2。(1)求纳什均衡点;(2)在纳什均衡下的最优反应函数;(3)若该
博弈重复无限次, 是否存在触发策略构成的子博弈完美纳什均衡, 其条件是什么?解:局中人1,2的最优反应函数分别为:
s 1=5+1/2s2s 2=20/3+1/3s1
由此得唯一的纯策略纳什均衡点:sc =(10,10).相应的有P(sc )=(1000,1500).容易求得s *=(35,30),相应的有P(s*)=(1750,3000),φ(s *) =(4000, 5042) .
当δ1≥
4000−17505042−3000
=0. 75, δ2≥=0. 576时,存在触发策略构成的子博弈完美
4000−10005042−1500
纳什均衡(s*,s c )
9. 求如图所示完全信息动态博弈的子博弈完美纳什均衡(图中数字(a,b,c)分别表示局中人1、2、3的收益)。
答:局中人1采取A 2行动,局中人2采取行动B 1时,局中人3必然采取C
2行动(因为32),因而该博弈的顶点只能是(2,1,9)。进而原博弈简化为:
这时, 假设局中人1采取行动A 1
,对于左边一个子博弈,局中人3必定采取行动C 2(31),因而在该子博弈顶点的结果只会是(7,6,6).进而, 该博弈又简化为:
这时,局中人1必然选择行动A 2(1
10. 考虑如下诉讼威胁博弈。
如果提起诉讼的话,局中人1为原告,局中人2为被告,博弈顺序如下:
(1)原告决定是否指控被告,指控的成本是c 1;(2)如果决定指控的话,在告上法庭之前,原告提出一个无协商余地的赔偿金额s 以私了;(3)被告决定接受还是拒绝原告的要求;(4)如果被告拒绝原告的要求,原告决定是放弃还是上法庭,自己的成本是c 2,给被告带来的成本是d ;(5)如果告上法庭,原告以概率P 胜诉而获得赔偿r ,否则什么也得不到。
试问胜诉概率P 满足什么条件时,原告的诉讼威胁才是可信的?
12, 1,-s)
一) 局中人1不指控局中人2时两个人的收益均为0
二) 局中人1决定指控局中人2,在告上法庭之前,局中人1提出一个无协商余地的赔偿金额s 以私了,
(1)当局中人2接受要求时局中人的收益为s-c 1; 局中人2的收益为-s ;(2)当局中人2拒绝局中人1的要求,
1) 局中人1放弃上诉时,局中人1的收益为-c 1, 局中人2的收益为0;
2) 当局中人1起诉时,局中人1的期望收益为Pr-(c1+c2); 局中人2的期望收益为-Pr-d 因此,当局中人1的期望收益P r -(c1+c2)>max{0,s-c1},即P>max{(c1+c2)/r,(s+c2)/r}时原告的诉讼威胁是可信的。
11. 在伯川德模型中, 假定有n 个生产企业, 需求函数为q i =a −p i +b
∑p
j =1j ≠i
n
j
(b>0),其中p i 是企业i
的定价,q i 是企业i 的需求量。假设企业生产没有固定成本, 并且边际成本为常数c,c
分以下几个步骤进行。1) 计算纳什均衡
当企业i 选择价格p i , 其它企业选择价格p j (j=1,2,…,n,j≠i) 时, 企业i 的利润为:πi =(p i −c ) q i =(p i −c )(a −p i +b (p 1+p 2+⋯+p i −1+p i +1+⋯+p n )) ,i=1,2,…,n
c c c
价格组合(p 1, p 2, ⋯, p c n ) 若是纳什均衡, 则对每个企业i, p i 应是如下最优问题的解:****max (p i −c )(a −p i +b (p 1+p *2+⋯p i −1+p i +1+⋯+p n ))
0≤p i
求解该问题, 得;
p i c
1
=(a +c +b p c j ) 2j =1
∑
j ≠i
n
i=1,2,..,n
解该方程组, 得:p i c =
a +c
,i=1,2,…,n
2−(n −1) b
a −c +bc (n −1) 2
)
2−(n −1) b
企业i 的利润为:πi c =(
2) 计算垄断情况下的价格
若n 家企业合并为一家, 即形成垄断价格, 则n 家企业的价格相同, 即p 1=p2=…=pn .
((n −1) b −1) c −a
可求得总利润最大时的价格为:p *=i
2((n −1) b −1)
*
那么每个企业的利润为πi
1(a +((n −1) b −1) c ) 2=−(这里(n-1)b
4(n −1) b −1
c
易证π*i >πi , 即在垄断价格下, 各企业的利润增加了。
3) 计算使垄断价格可以作为完美均衡结果出现的最低贴现因子δ,并解释δ与n 的关系。
φi (p *) =(
a −c (n −1) b (((n −1) b −1) c −a ) 2
−24((n −1) b −1)
a −c (n −1) b (((n −1) b −1) c −a ) 21(a +((n −1) b −1) c ) 2
(−) +
φi (p *) −π*24((n −1) b −1) 4(n −1) b −1i
当δ≥时, 触发策=
22φi (p *) −πc i (−) −() 24((n −1) b −1) 2−(n −1) b
略(p*,p c ) 是子博弈完美纳什均衡.
12. 有一在位企业生产某种产品,其成本可能低,也可能高。该企业可以选择低价或高价两种策略。另一企业准备进入生产同类产品,但完全不知道在位企业的生产成本是高还是低,只能观察到其价格是低价还是高价。其具体收益见下面博弈的扩展式表述。求该博弈的子博弈完美贝叶斯纳什均衡。
该题的求解与第115页例题类似。
13. 求例3.4.1的子博弈完美贝叶斯纳什均衡。
第三章纳什均衡的扩展与精炼
1. 什么是完全信息和不完全信息?什么是完美信息和不完美信息?在海萨尼转换中,自然对局中人类型的确定都是有限的吗?举例说明。(见教材)
2. 什么是重复博弈中的策略? 什么是一个重复博弈中的子博弈? 什么是一个子博弈完美纳什均衡? (见教材)
3. 以下(虚线框中的)子博弈的划分是否正确?
答:两个扩展式中的子博弈划分均不正确,图1中的划分对同一信息集产生了分割,图2中的子博弈不是开始于单节信息集的决策结点。
4. 在双寡头古诺模型中, 设逆需求函数为p=a-Q,其中Q=q1+q2为市场总需求, 但a 有a H 和a L 两种可能的情况, 并且企业1知道a 究竟是a H 还是a L , 而企业2只知道a=aH 和a=aL 的概率分别是θ和1-θ,该信息是双方都知道的。双方的总成本函数分别是cq 1和cq 2。如果两企业同时选择产量, 双方的策略空间是什么?试计算出贝叶斯纳什均衡。
假设企业2的产量为q 2,企业1将选择q 1最大化利润函数
π1=q 1(a −q 1−q 2−c 1) (这里a 取a H 或a L )
由此得:
1
q 1H =(a H −q 2−c 1)
21
q 1L =(a L −q 2−c 1)
2
企业2将选择q 2最大化它的期望利润
E (π2) =θq 2(a H −q 1H −q 2−c 2) +(1−θ) q 2(a L −q 1L −q 2−c 2) 1
[θa H +(1−θ) a L −(θq 1H +(1−θ) q 1L ) −c 2]2
在均衡时,q 1,q 2应满足
由此得:q 2=
1⎧q =(a −q 2−c 1) 1⎪⎪2⎨
⎪q =1[θa +(1−θ) a −(θq +(1−θ) q ) −c ]2H L 1H 1L 2⎪2⎩
由此得:
企业1的策略为:
11*
q 1=(a −c ) −[θa H +(1−θ) a L +c 1−2c 2]H H 1
2611*
q 1(a L −c 1) −[θa H +(1−θ) a L +c 1−2c 2]L =
26企业2的策略为:
1q *=[θa H +(1−θ) a L +c 1−2c 2]2
3
**
因此博弈的贝叶斯纳什均衡是:当a=aH 时,企业1生产q 1H ;当a=aL 时,企业1生产q 1L ,
企业2生产q *2。
5. 在下面的静态贝叶斯博弈中, 求出所有的纯策略贝叶斯纳什均衡。
(1)自然决定收益情况是由博弈1给出,还是由博弈2给出,选择每一博弈的概率相等;(2)局中人1了解到自然选择了博弈1,还是选择了博弈2,但局中人2不知道;(3)局中人1选择行动T 或B ,同时局中人2选择行动L 或R ;(4)根据自然选择的博弈,两局中人得到相应的收益。
L T B
1,10,0
R 0,00,0
T B
L 0,00,0
R 0,02,2
博弈1
博弈2
自然选择了博弈1时,局中人1选择T ,自然选择了博弈2时,局中人1选择B 。局中人2的策略是根据期望收益最大的原则确定。
局中人2的选择策略L 的期望收益为0.5×1+0.5×0=0.5,选择策略R 的期望收益为0.5×0+0.5×2=1,因此局中人2会选择策略R 。
该博弈的纯策略贝叶斯纳什均衡为:自然选择博弈1时,局中人1选择T ,自然选择博弈2时,局中人1选择B ;局中人2会选择策略R 。
6. 在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-q1-q 2-q 3,这里q i 是企业i 的产量。每一企业生产的单位成本为常数c 。三企业决定各自产量的顺序如下:(1)企业1首先选择q 1≥0;(2)企业2和企业3观察到q 1,然后同时分别选择q 2和q 3。试解出该博弈的子博弈完
美纳什均衡。
答:该博弈分为两个阶段,第一阶段企业1选择产量q 1,第二阶段企业2和3观测到q 1后,他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。
(1)假设企业1已选定产量q 1,先进行第二阶段的计算。设企业2,3的利润函数分别为:
π2=(a −q 1−q 2−q 3) q 2−cq 2π3=(a −q 1−q 2−q 3) q 2−cq 3
由于两企业均要追求利润最大,故对以上两式分别求一阶条件:
∂π=a −q 1−2q 2−q 3−c =0∂q 2
∂π3
=a −q 1−q 2−2q 3−c =0∂q 3
(1)(2)
求解(1)、(2)组成的方程组有:
*
q *2=q 3=
a −q 1−c
3
(3)
(2)现进行第一阶段的博弈分析:对与企业1,其利润函数为;
π1=(a −q 1−q 2−q 3) q 1−cq 1
将(3)代入可得:
π1=
q 1(a −q 1−c )
3
(4)
式(4)对q 1求导:
∂π1
=a −2q 1−c =0∂q 1
解得:
*q 1=
*
此时,π1=
1
(a −c ) 2
(5)
1
(a −c ) 212
11*(a −c ) , q *(a −c ) 2=q 3=26
(3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡:
*
q 1=
7. 如果将如下的囚徒困境博弈重复进行无穷次,惩罚机制为触发策略,贴现因子为δ。试问
δ应满足什么条件,才存在子博弈完美纳什均衡?
乙
甲坦白不坦白
坦白4,45,0
不坦白0,51,1
由划线法求得该博弈的纯策略纳什均衡点为(不坦白, 不坦白) ,均衡结果为(1,1),采用触发策略,局中人i 的策略组合s 的最好反应支付φi (s ) =max P i (s −i , s i ) =5,Pi (s*)=4,P i (sc )=1。若存
s i ∈S i
φi (s *) −P i (s *) 5−41
==,即只有当贴现因子δ>1/4在子博弈完美纳什均衡,必须满足:δ≥
φi (s ) −P i (s ) 5−14
时,才存在子博弈完美纳什均衡。
2
8. 假设有一博弈G=[N,S,P],其中N={1,2},S1=[0,50],S2=[0,50],P 1(s ) =100s 1−10s 1+10s 1s 2,
P 2(s ) =200s 2−15s 22+10s 1s 2,i=1,2。(1)求纳什均衡点;(2)在纳什均衡下的最优反应函数;(3)若该
博弈重复无限次, 是否存在触发策略构成的子博弈完美纳什均衡, 其条件是什么?解:局中人1,2的最优反应函数分别为:
s 1=5+1/2s2s 2=20/3+1/3s1
由此得唯一的纯策略纳什均衡点:sc =(10,10).相应的有P(sc )=(1000,1500).容易求得s *=(35,30),相应的有P(s*)=(1750,3000),φ(s *) =(4000, 5042) .
当δ1≥
4000−17505042−3000
=0. 75, δ2≥=0. 576时,存在触发策略构成的子博弈完美
4000−10005042−1500
纳什均衡(s*,s c )
9. 求如图所示完全信息动态博弈的子博弈完美纳什均衡(图中数字(a,b,c)分别表示局中人1、2、3的收益)。
答:局中人1采取A 2行动,局中人2采取行动B 1时,局中人3必然采取C
2行动(因为32),因而该博弈的顶点只能是(2,1,9)。进而原博弈简化为:
这时, 假设局中人1采取行动A 1
,对于左边一个子博弈,局中人3必定采取行动C 2(31),因而在该子博弈顶点的结果只会是(7,6,6).进而, 该博弈又简化为:
这时,局中人1必然选择行动A 2(1
10. 考虑如下诉讼威胁博弈。
如果提起诉讼的话,局中人1为原告,局中人2为被告,博弈顺序如下:
(1)原告决定是否指控被告,指控的成本是c 1;(2)如果决定指控的话,在告上法庭之前,原告提出一个无协商余地的赔偿金额s 以私了;(3)被告决定接受还是拒绝原告的要求;(4)如果被告拒绝原告的要求,原告决定是放弃还是上法庭,自己的成本是c 2,给被告带来的成本是d ;(5)如果告上法庭,原告以概率P 胜诉而获得赔偿r ,否则什么也得不到。
试问胜诉概率P 满足什么条件时,原告的诉讼威胁才是可信的?
12, 1,-s)
一) 局中人1不指控局中人2时两个人的收益均为0
二) 局中人1决定指控局中人2,在告上法庭之前,局中人1提出一个无协商余地的赔偿金额s 以私了,
(1)当局中人2接受要求时局中人的收益为s-c 1; 局中人2的收益为-s ;(2)当局中人2拒绝局中人1的要求,
1) 局中人1放弃上诉时,局中人1的收益为-c 1, 局中人2的收益为0;
2) 当局中人1起诉时,局中人1的期望收益为Pr-(c1+c2); 局中人2的期望收益为-Pr-d 因此,当局中人1的期望收益P r -(c1+c2)>max{0,s-c1},即P>max{(c1+c2)/r,(s+c2)/r}时原告的诉讼威胁是可信的。
11. 在伯川德模型中, 假定有n 个生产企业, 需求函数为q i =a −p i +b
∑p
j =1j ≠i
n
j
(b>0),其中p i 是企业i
的定价,q i 是企业i 的需求量。假设企业生产没有固定成本, 并且边际成本为常数c,c
分以下几个步骤进行。1) 计算纳什均衡
当企业i 选择价格p i , 其它企业选择价格p j (j=1,2,…,n,j≠i) 时, 企业i 的利润为:πi =(p i −c ) q i =(p i −c )(a −p i +b (p 1+p 2+⋯+p i −1+p i +1+⋯+p n )) ,i=1,2,…,n
c c c
价格组合(p 1, p 2, ⋯, p c n ) 若是纳什均衡, 则对每个企业i, p i 应是如下最优问题的解:****max (p i −c )(a −p i +b (p 1+p *2+⋯p i −1+p i +1+⋯+p n ))
0≤p i
求解该问题, 得;
p i c
1
=(a +c +b p c j ) 2j =1
∑
j ≠i
n
i=1,2,..,n
解该方程组, 得:p i c =
a +c
,i=1,2,…,n
2−(n −1) b
a −c +bc (n −1) 2
)
2−(n −1) b
企业i 的利润为:πi c =(
2) 计算垄断情况下的价格
若n 家企业合并为一家, 即形成垄断价格, 则n 家企业的价格相同, 即p 1=p2=…=pn .
((n −1) b −1) c −a
可求得总利润最大时的价格为:p *=i
2((n −1) b −1)
*
那么每个企业的利润为πi
1(a +((n −1) b −1) c ) 2=−(这里(n-1)b
4(n −1) b −1
c
易证π*i >πi , 即在垄断价格下, 各企业的利润增加了。
3) 计算使垄断价格可以作为完美均衡结果出现的最低贴现因子δ,并解释δ与n 的关系。
φi (p *) =(
a −c (n −1) b (((n −1) b −1) c −a ) 2
−24((n −1) b −1)
a −c (n −1) b (((n −1) b −1) c −a ) 21(a +((n −1) b −1) c ) 2
(−) +
φi (p *) −π*24((n −1) b −1) 4(n −1) b −1i
当δ≥时, 触发策=
22φi (p *) −πc i (−) −() 24((n −1) b −1) 2−(n −1) b
略(p*,p c ) 是子博弈完美纳什均衡.
12. 有一在位企业生产某种产品,其成本可能低,也可能高。该企业可以选择低价或高价两种策略。另一企业准备进入生产同类产品,但完全不知道在位企业的生产成本是高还是低,只能观察到其价格是低价还是高价。其具体收益见下面博弈的扩展式表述。求该博弈的子博弈完美贝叶斯纳什均衡。
该题的求解与第115页例题类似。
13. 求例3.4.1的子博弈完美贝叶斯纳什均衡。