逆向归纳法(Banet)
逆向归纳法是一种常用于动态博弈的求解方法,核心思想是从博弈的最后阶段开始推导,逐步回溯,找到最优策略。
这种方法通常用于有限步博弈(finitegames),尤其是在完全信息动态博弈中,即所有参与者都知道游戏规则和其他玩家的可能选择。
逆向归纳法的基本步骤
1。从最后一步开始分析:假设已经到达博弈的最后一个决策节点,找出在此节点上每个玩家的最优策略。
2。回溯至前一步:假设前一个决策者知道后续的最优选择,并据此做出最优决策。
3。重复以上过程,直至回溯到起点:最终得出的策略就是整个博弈的最优均衡解。
案例分析
1。终局博弈(u1timatumgame)
假设有两个玩家:
?a玩家分配1oo元,决定给B玩家多少钱(整数)。
?B玩家可以选择接受(accept)或拒绝(Reject):
?如果接受,双方按a的分配拿钱。
?如果拒绝,双方都拿不到钱。
逆向归纳分析
1。B的决策(最后一步):
?如果B接受,他能获得分配到的钱。
?如果B拒绝,双方都拿不到钱。
?理性B玩家应接受任何非零金额,因为比o更好。
2。a的决策(回溯):
?a知道B会接受任何非零金额,所以a的最优策略是给B最少的钱(如1元),自己拿99元。
结论:a分1元,B接受,这是均衡策略。
2。进入威胁博弈(entrydeterrencegame)
假设一个新企业(e)考虑进入市场,而已有企业(I)可以选择降价竞争(Fierce)或维持高价(acmodate)。
博弈树
1。e决定是否进入市场:
?进入(enter)
?不进入(stayout)
2。如果e进入,I决定策略:
?降价(Fierce):I和e都亏损-1o。
?高价(acmodate):I赚1o,e赚5。
?e不进入(stayout):I独占市场,赚15,e赚o。
逆向归纳分析
1。I的决策(最后一步):
?如果e已进入,I在降价(-1o)和高价(1o)之间选择,高价更优,所以I会选择高价。
2。e的决策(回溯):
?知道I不会降价,e进入后可以赚5(比o好),所以e会进入市场。
结论:e进入,I维持高价,这是均衡策略。
3。百吉饼博弈(nettipedegame)
假设有两个玩家轮流决定**“拿走(Take)”还是“继续(pass)”**奖金池: