博弈论入门笔记的最后一篇,终于要谈到一点更接近现实的东西。
首先再回顾纳什均衡的含义:任何人的策略相对于其他人都是最好的,也就是说,在达到纳什均衡时,一个参与者任何的策略改变都会导致一个对自身比现在更差的结果。
对纳什均衡很有意思的一个观察结论是,这是一种博弈结果,它只是说,在纳什均衡的情况下,你做出的改变都是对个人不利的,但,这并不意味着纳什均衡是最好的选择。比如qwerty键盘。有没有比这种键盘更好的输入方式?答案肯定是有,但是如果任何其他人都还在使用这种键盘,那么你个人改变使用键盘的习惯,就可能导致一种不兼容。这样,最终的结果是你自己无法被抛弃。
这里说到的问题其实是纳什均衡的无效率问题。这是什么意思呢,就是说,纳什均衡时从博弈出发的,他追求的是个人相对他人利益的最大化,但是,个人相对他人利益最大化的总和未必就能促进社会本身的发展。
再换一种说法,纳什均衡表现的是个体理性,但个体理性未必是一个社会整体的最好选择。个体理性不同于群体理性。
以囚徒困境的例子为例。如果两名囚犯合作,那么他们的支付结果是(2,2),但是,由于任何一个人背叛合作就可能使自己的支付变成0,使得对手变为-10,那么从个体理性出发,任何人不敢采取合作策略,因为如果自己采取合作策略,对方就可能使你的支付变成-10。这不是最好的选择,于是乎,囚犯都会选择不合作。这样,纳什均衡达成,每个人的支付是(1,1)。
从这个例子上就看出,如果从群体理性出发,双方合作是最好的选择;但从个体理性出发,双方都不合作才是最好的选择。这就说明,个体理性不同于群体理性。个体理性的总和可能小于群体理性。
在环保问题上,这个问题非常明显。例如,虽然大家都知道每个人环保,那么这个世界就会变得更好。但是,在没有任何约束之下,一个人做出环保的举动是有代价的。比如,你每天改为做公交,减少污染排放,这样总的污染是下降的,但是,在没有任何约束的情况下,别人可能继续开车,这样他既没有让自己增加交通成本,而且有均摊了污染下降的好处。
这样的结果是什么?那就是你也不是傻子,你也不想我做了好事,但是却被别人占有了,所以你也不要环保了,继续污染。而且更为严重的是,在没有任何约束的情况下,你还有可能变本加厉污染,因为只要你比别人污染的更多,你总体上获得的效用就可能更多。别人也不傻,如此循环,于是污染终于越来越严重。
个体理性不同于群体理性,这一点并不是得到普遍认可的。比如经济学的鼻祖亚当斯密就说,每个人的自利最终会增进社会的总体福利。在一个充分竞争的市场上,这是成立的。但是,直到博弈论出现,这一观点才受到了更多的质疑。
从诺贝尔经济学奖得主的名单上可以看出博弈论后来的胜出。在上世纪70-80年代,诺奖得主是哈耶克,贝克尔,弗里德曼等自由派经济学者,但在后来,纳什,马斯金,罗斯,以及最新的梯若尔都是博弈论的大家。当然在此之前,肯尼斯阿罗等人也是博弈论的运用者。
既然个体理性不等于群体理性甚至会导致社会整体福利下降,那么怎么做呢?从刚才环保的例子看,一个导致污染的原因其实可能是约束的缺乏或者策略的缺失。于是,从社会整体福利的角度看,要达到社会理性的最大,就必须有强制手段。这些手段总结为一下几点:
1 改变博弈的策略
博弈论是从博弈规则出发,导出结果。反过来,我们可以反过来,看好的结果是什么,然后改变规则。一个例子是医院与青年医生的配对,研究者是诺奖得主罗斯。
2 建立契约
违背契约的遭受惩罚。使得违约受益小于惩罚。这点比较简单。
但是诉讼成本过高有时候也会妨碍契约效力。有时候也无法建立契约,比如全球变暖。
3 长期关系
很多时候是无法建立契约的。这时候可能通过建立长期联系来提供总收益。
这一策略的原理是,你可以获得一次性收益,但代价是付出所有未来收益,而未来收益远高于一次性收益,于是因为惧怕损失,你必须保持长期关系。
举个例子,旅游区的一家饭馆,因为人人可能只来一次,所以非常有漫天要价恶劣服务的问题。但是,由于社交媒体的使用,一旦你有问题,用餐者会马上通过社交媒体让你名誉扫地,如此你的生意就没法做了。
说到这,博弈论入门笔记基本到此结束了。最后是一个对博弈论的总结笔记:
1 博弈论提供一个总的原则,适应于所有社会问题的解决
2 纳什均衡的出现原因众多,无论参与者是理性,不理性,还是无智商,都有可能达成纳什均衡。
3在不同的应用中,博弈论的预测力量并不一样。相对越复杂的情况,比如选举,博弈论的预测能力就越差。
4 博弈论的预测能力虽然不完美,但是是有用的。以选举为例,博弈论可以给我们以有益的洞察,提供思考的出发点(投票中位数理论)。人们不可能总是达成纳什均衡,但是稳定的行为模式即纳什均衡还是经常观察得到。
5 最重要的是,个体理性和群体理性不一致。因此为了社会的总体福利,需要解决个体理性和群体理性的不一致问题。
博弈论入门笔记的最后一篇,终于要谈到一点更接近现实的东西。
首先再回顾纳什均衡的含义:任何人的策略相对于其他人都是最好的,也就是说,在达到纳什均衡时,一个参与者任何的策略改变都会导致一个对自身比现在更差的结果。
对纳什均衡很有意思的一个观察结论是,这是一种博弈结果,它只是说,在纳什均衡的情况下,你做出的改变都是对个人不利的,但,这并不意味着纳什均衡是最好的选择。比如qwerty键盘。有没有比这种键盘更好的输入方式?答案肯定是有,但是如果任何其他人都还在使用这种键盘,那么你个人改变使用键盘的习惯,就可能导致一种不兼容。这样,最终的结果是你自己无法被抛弃。
这里说到的问题其实是纳什均衡的无效率问题。这是什么意思呢,就是说,纳什均衡时从博弈出发的,他追求的是个人相对他人利益的最大化,但是,个人相对他人利益最大化的总和未必就能促进社会本身的发展。
再换一种说法,纳什均衡表现的是个体理性,但个体理性未必是一个社会整体的最好选择。个体理性不同于群体理性。
以囚徒困境的例子为例。如果两名囚犯合作,那么他们的支付结果是(2,2),但是,由于任何一个人背叛合作就可能使自己的支付变成0,使得对手变为-10,那么从个体理性出发,任何人不敢采取合作策略,因为如果自己采取合作策略,对方就可能使你的支付变成-10。这不是最好的选择,于是乎,囚犯都会选择不合作。这样,纳什均衡达成,每个人的支付是(1,1)。
从这个例子上就看出,如果从群体理性出发,双方合作是最好的选择;但从个体理性出发,双方都不合作才是最好的选择。这就说明,个体理性不同于群体理性。个体理性的总和可能小于群体理性。
在环保问题上,这个问题非常明显。例如,虽然大家都知道每个人环保,那么这个世界就会变得更好。但是,在没有任何约束之下,一个人做出环保的举动是有代价的。比如,你每天改为做公交,减少污染排放,这样总的污染是下降的,但是,在没有任何约束的情况下,别人可能继续开车,这样他既没有让自己增加交通成本,而且有均摊了污染下降的好处。
这样的结果是什么?那就是你也不是傻子,你也不想我做了好事,但是却被别人占有了,所以你也不要环保了,继续污染。而且更为严重的是,在没有任何约束的情况下,你还有可能变本加厉污染,因为只要你比别人污染的更多,你总体上获得的效用就可能更多。别人也不傻,如此循环,于是污染终于越来越严重。
个体理性不同于群体理性,这一点并不是得到普遍认可的。比如经济学的鼻祖亚当斯密就说,每个人的自利最终会增进社会的总体福利。在一个充分竞争的市场上,这是成立的。但是,直到博弈论出现,这一观点才受到了更多的质疑。
从诺贝尔经济学奖得主的名单上可以看出博弈论后来的胜出。在上世纪70-80年代,诺奖得主是哈耶克,贝克尔,弗里德曼等自由派经济学者,但在后来,纳什,马斯金,罗斯,以及最新的梯若尔都是博弈论的大家。当然在此之前,肯尼斯阿罗等人也是博弈论的运用者。
既然个体理性不等于群体理性甚至会导致社会整体福利下降,那么怎么做呢?从刚才环保的例子看,一个导致污染的原因其实可能是约束的缺乏或者策略的缺失。于是,从社会整体福利的角度看,要达到社会理性的最大,就必须有强制手段。这些手段总结为一下几点:
1 改变博弈的策略
博弈论是从博弈规则出发,导出结果。反过来,我们可以反过来,看好的结果是什么,然后改变规则。一个例子是医院与青年医生的配对,研究者是诺奖得主罗斯。
2 建立契约
违背契约的遭受惩罚。使得违约受益小于惩罚。这点比较简单。
但是诉讼成本过高有时候也会妨碍契约效力。有时候也无法建立契约,比如全球变暖。
3 长期关系
很多时候是无法建立契约的。这时候可能通过建立长期联系来提供总收益。
这一策略的原理是,你可以获得一次性收益,但代价是付出所有未来收益,而未来收益远高于一次性收益,于是因为惧怕损失,你必须保持长期关系。
举个例子,旅游区的一家饭馆,因为人人可能只来一次,所以非常有漫天要价恶劣服务的问题。但是,由于社交媒体的使用,一旦你有问题,用餐者会马上通过社交媒体让你名誉扫地,如此你的生意就没法做了。
说到这,博弈论入门笔记基本到此结束了。最后是一个对博弈论的总结笔记:
1 博弈论提供一个总的原则,适应于所有社会问题的解决
2 纳什均衡的出现原因众多,无论参与者是理性,不理性,还是无智商,都有可能达成纳什均衡。
3在不同的应用中,博弈论的预测力量并不一样。相对越复杂的情况,比如选举,博弈论的预测能力就越差。
4 博弈论的预测能力虽然不完美,但是是有用的。以选举为例,博弈论可以给我们以有益的洞察,提供思考的出发点(投票中位数理论)。人们不可能总是达成纳什均衡,但是稳定的行为模式即纳什均衡还是经常观察得到。
5 最重要的是,个体理性和群体理性不一致。因此为了社会的总体福利,需要解决个体理性和群体理性的不一致问题。