博弈(game)是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与者依据各自所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。博弈论(game theory)是一种研究人们怎么做策略(行动)选择,及其最后的均衡结果会是什么的理论。


第一次学个定义就差不多了。有个强盗分金币的游戏。

5个强盗来分100个金币。首先由第一个强盗提出分配方案,如果5个强盗中半数或半数以上通过(包括自己在内),则分配方案成立,分配结束。若不能通过,则第一个强盗将被扔到海里,并继续由第二个强盗提出分配方案。如此往复,一直到有人提出的分配方案通过为止。

问题:假设5个强盗都是个人利益最大化的追求者(理性,足够聪明),并且决策的顺序事先已排好。那么,你希望自己排在第几位?如果你抽签后,被排在第一位,那么作为第一个强盗的你,将会提出一个怎样的分配方案,以便让自己得到最大的利益?
如果强盗的数量从5个变成了1000个,那么最后的分配结果又会是如何?

梳理一下,站在海盗个人的角度看,有这几条规则:

  1. 保命优先,分钱其次
  2. 利益最大化
  3. 收益相同,最好杀掉

假定强盗是1,2,3,4,5,由1开始出方案,方案1对应强盗1。反向思考。首先轮不到强盗5来分。强盗4要独吞——方案4,必须先把强盗3扔下去。强盗3知道强盗4要投反对票,他只能拉拢强盗5——方案3,必须先把强盗2扔下去。强盗2知道强盗3要杀他,所以拉拢强盗4——方案2,必须先把强盗1扔下去。为了不被扔下去,强盗1只能拉拢强盗3、5。所以你的方案是(98,0,1,0,1)。

方案 强盗1 强盗2 强盗3 强盗4 强盗5 说明
4 100 0 独吞
3 99 0 1 拉拢强盗5
2 99 0 1 0 拉拢强盗4
1 98 0 1 0 1 拉拢强盗3、5

总结规律,拉拢上一轮倒推时没收益的,1金币/人,能获得半数选票的同时,自己收益最大。

1……1000:按此思路100金币,只够倒数200人分,后面说的都是倒数。

201没有金币可分,为了保命会无条件支持202。

202随意,确定可以活下来😄。

203为了保命,会无条件支持204。

204一票 + 203一票 + 100金币可以获得半数,204确定可以活下来😄。

205为了保命,会无条件支持206。206的票 + 205的票 + 100金币不够半数,所以206也会无条件支持207。同理207也会无条件支持208。

208的票 + 207的 + 206的 + 205的 + 100金币足够半数,所以208确定可以活下来😄。

总结规律:200+2n200 + 2^n 的强盗确定可以活下来。这个规律到什么时候为止呢?200+29=712200 + 2^9 = 712,即之前的288个强盗会被扔下去,只能怪命不好喽。