笔趣阁

三千五中文网>职场小聪明 > 第475章 逆向归纳法(第1页)

第475章 逆向归纳法(第1页)

逆向归纳法(Banet)

逆向归纳法是一种常用于动态博弈的求解方法,核心思想是从博弈的最后阶段开始推导,逐步回溯,找到最优策略。

这种方法通常用于有限步博弈(finitegames),尤其是在完全信息动态博弈中,即所有参与者都知道游戏规则和其他玩家的可能选择。

逆向归纳法的基本步骤

1。从最后一步开始分析:假设已经到达博弈的最后一个决策节点,找出在此节点上每个玩家的最优策略。

2。回溯至前一步:假设前一个决策者知道后续的最优选择,并据此做出最优决策。

3。重复以上过程,直至回溯到起点:最终得出的策略就是整个博弈的最优均衡解。

案例分析

1。终局博弈(u1timatumgame)

假设有两个玩家:

?a玩家分配1oo元,决定给B玩家多少钱(整数)。

?B玩家可以选择接受(accept)或拒绝(Reject):

?如果接受,双方按a的分配拿钱。

?如果拒绝,双方都拿不到钱。

逆向归纳分析

1。B的决策(最后一步):

?如果B接受,他能获得分配到的钱。

?如果B拒绝,双方都拿不到钱。

?理性B玩家应接受任何非零金额,因为比o更好。

2。a的决策(回溯):

?a知道B会接受任何非零金额,所以a的最优策略是给B最少的钱(如1元),自己拿99元。

结论:a分1元,B接受,这是均衡策略。

2。进入威胁博弈(entrydeterrencegame)

假设一个新企业(e)考虑进入市场,而已有企业(I)可以选择降价竞争(Fierce)或维持高价(acmodate)。

博弈树

1。e决定是否进入市场:

?进入(enter)

?不进入(stayout)

2。如果e进入,I决定策略:

?降价(Fierce):I和e都亏损-1o。

?高价(acmodate):I赚1o,e赚5。

?e不进入(stayout):I独占市场,赚15,e赚o。

逆向归纳分析

1。I的决策(最后一步):

?如果e已进入,I在降价(-1o)和高价(1o)之间选择,高价更优,所以I会选择高价。

2。e的决策(回溯):

?知道I不会降价,e进入后可以赚5(比o好),所以e会进入市场。

结论:e进入,I维持高价,这是均衡策略。

3。百吉饼博弈(nettipedegame)

假设有两个玩家轮流决定**“拿走(Take)”还是“继续(pass)”**奖金池:

已完结热门小说推荐

最新标签