博弈(game)是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与者依据各自所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。博弈论(game theory)是一种研究人们怎么做策略(行动)选择,及其最后的均衡结果会是什么的理论。
第一次学个定义就差不多了。有个强盗分金币的游戏。
5个强盗来分100个金币。首先由第一个强盗提出分配方案,如果5个强盗中半数或半数以上通过(包括自己在内),则分配方案成立,分配结束。若不能通过,则第一个强盗将被扔到海里,并继续由第二个强盗提出分配方案。如此往复,一直到有人提出的分配方案通过为止。
问题:假设5个强盗都是个人利益最大化的追求者(理性,足够聪明),并且决策的顺序事先已排好。那么,你希望自己排在第几位?如果你抽签后,被排在第一位,那么作为第一个强盗的你,将会提出一个怎样的分配方案,以便让自己得到最大的利益?
如果强盗的数量从5个变成了1000个,那么最后的分配结果又会是如何?
梳理一下,站在海盗个人的角度看,有这几条规则:
- 保命优先,分钱其次
- 利益最大化
- 收益相同,最好杀掉
假定强盗是1,2,3,4,5,由1开始出方案,方案1对应强盗1。反向思考。首先轮不到强盗5来分。强盗4要独吞——方案4,必须先把强盗3扔下去。强盗3知道强盗4要投反对票,他只能拉拢强盗5——方案3,必须先把强盗2扔下去。强盗2知道强盗3要杀他,所以拉拢强盗4——方案2,必须先把强盗1扔下去。为了不被扔下去,强盗1只能拉拢强盗3、5。所以你的方案是(98,0,1,0,1)。
| 方案 |
强盗1 |
强盗2 |
强盗3 |
强盗4 |
强盗5 |
说明 |
| 4 |
|
|
|
100 |
0 |
独吞 |
| 3 |
|
|
99 |
0 |
1 |
拉拢强盗5 |
| 2 |
|
99 |
0 |
1 |
0 |
拉拢强盗4 |
| 1 |
98 |
0 |
1 |
0 |
1 |
拉拢强盗3、5 |
总结规律,拉拢上一轮倒推时没收益的,1金币/人,能获得半数选票的同时,自己收益最大。
1……1000:按此思路100金币,只够倒数200人分,后面说的都是倒数。
201没有金币可分,为了保命会无条件支持202。
202随意,确定可以活下来😄。
203为了保命,会无条件支持204。
204一票 + 203一票 + 100金币可以获得半数,204确定可以活下来😄。
205为了保命,会无条件支持206。206的票 + 205的票 + 100金币不够半数,所以206也会无条件支持207。同理207也会无条件支持208。
208的票 + 207的 + 206的 + 205的 + 100金币足够半数,所以208确定可以活下来😄。
总结规律:200+2n 的强盗确定可以活下来。这个规律到什么时候为止呢?200+29=712,即之前的288个强盗会被扔下去,只能怪命不好喽。