第475章逆向归纳法第1页_职场小聪明(翟晓鹰)

三千五中文网>职场小聪明 > 第475章逆向归纳法（第1页）

第475章逆向归纳法（第1页）

逆向归纳法（Banet）

逆向归纳法是一种常用于动态博弈的求解方法，核心思想是从博弈的最后阶段开始推导，逐步回溯，找到最优策略。

这种方法通常用于有限步博弈（finitegames），尤其是在完全信息动态博弈中，即所有参与者都知道游戏规则和其他玩家的可能选择。

逆向归纳法的基本步骤

1。从最后一步开始分析：假设已经到达博弈的最后一个决策节点，找出在此节点上每个玩家的最优策略。

2。回溯至前一步：假设前一个决策者知道后续的最优选择，并据此做出最优决策。

3。重复以上过程，直至回溯到起点：最终得出的策略就是整个博弈的最优均衡解。

案例分析

1。终局博弈（u1timatumgame）

假设有两个玩家：

?a玩家分配1oo元，决定给B玩家多少钱（整数）。

?B玩家可以选择接受（accept）或拒绝（Reject）：

?如果接受，双方按a的分配拿钱。

?如果拒绝，双方都拿不到钱。

逆向归纳分析

1。B的决策（最后一步）：

?如果B接受，他能获得分配到的钱。

?如果B拒绝，双方都拿不到钱。

?理性B玩家应接受任何非零金额，因为比o更好。

2。a的决策（回溯）：

?a知道B会接受任何非零金额，所以a的最优策略是给B最少的钱（如1元），自己拿99元。

结论：a分1元，B接受，这是均衡策略。

2。进入威胁博弈（entrydeterrencegame）

假设一个新企业（e）考虑进入市场，而已有企业（I）可以选择降价竞争（Fierce）或维持高价（acmodate）。

博弈树

1。e决定是否进入市场：

?进入（enter）

?不进入（stayout）

2。如果e进入，I决定策略：

?降价（Fierce）：I和e都亏损-1o。

?高价（acmodate）：I赚1o，e赚5。

?e不进入（stayout）：I独占市场，赚15，e赚o。

逆向归纳分析

1。I的决策（最后一步）：

?如果e已进入，I在降价（-1o）和高价（1o）之间选择，高价更优，所以I会选择高价。

2。e的决策（回溯）：

?知道I不会降价，e进入后可以赚5（比o好），所以e会进入市场。

结论：e进入，I维持高价，这是均衡策略。

3。百吉饼博弈（nettipedegame）

假设有两个玩家轮流决定**“拿走（Take）”还是“继续（pass）”**奖金池：

笔趣阁

三千五中文网>职场小聪明 > 第475章逆向归纳法（第1页）