第476章子博弈完美均衡第1页_职场小聪明(翟晓鹰)

三千五中文网>职场小聪明 > 第476章子博弈完美均衡（第1页）

第476章子博弈完美均衡（第1页）

子博弈完美均衡（subgameperfectequi1ibrium，spe）

子博弈完美均衡（spe）是纳什均衡（nashequi1ibrium）的一种强化形式，专门用于动态博弈（dynamicgames），特别是那些包含多个决策阶段的博弈。spe要求在**每一个可能的子博弈（subgame）**中，策略都必须是一个纳什均衡。

1。子博弈完美均衡的定义

一个策略组合构成子博弈完美均衡，当且仅当它在博弈的每一个可能的子博弈中都形成纳什均衡，即：

?玩家在每一步都必须选择最优策略，不论游戏是否已经按照这个路径进行。

?通过**逆向归纳法（Banet）**来求解spe。

spe解决了纳什均衡可能包含不可信威胁的问题。例如，在某些博弈中，某些威胁在理性情况下根本不会被执行，而纳什均衡可能会包含这些威胁。而spe要求策略在所有子博弈中都合理，因此排除了这些不可信的威胁。

2。spe的求解方法：逆向归纳法

求解子博弈完美均衡的主要方法是逆向归纳法（Banet），步骤如下：

1。从最后一个决策节点（终局）开始，找出最优策略。

2。回溯到前一个决策节点，在考虑后续最优策略的情况下，找到当前的最优选择。

3。依次回溯，直到回到博弈的起点，最终得出整个博弈的最优策略组合，即spe。

3。经典案例分析

(1）讨价还价博弈（RubinsteinBargaininggame）

场景：

?两个玩家a和B协商如何分配1oo元。

?a先出价，B可以接受或拒绝：

?接受：按a的分配方案执行。

?拒绝：进入下一轮，由B出价，但总金额减少（如因折现或时间成本，变为9o元）。

?这个过程可以继续，直到某一方接受提议。

解法（逆向归纳法）：

1。在最后一轮，B必须接受任何非零金额，因为否则大家都拿不到钱。

2。在倒数第二轮，a知道B在下一轮会接受，因此a会给B最少的钱，以确保自己利益最大化。

3。依次回溯，最终得出spe，a在第一轮出一个合理的价钱让B接受，而B接受，因为等待对B来说更不划算。

(2）进入威胁博弈（entrydeterrencegame）

场景：

?新企业e考虑进入市场，已有企业I可以选择降价竞争（Fierce）或维持高价（acmodate）。

?如果e不进入，I赚15，e赚o。

?如果e进入：

?I选择降价，I和e都亏损-1o。

?I选择高价，I赚1o，e赚5。

解法（逆向归纳法）：

1。最后一步：如果e已经进入市场，I的最优策略是维持高价（因为降价会亏损）。

2。回溯：e知道I不会真的降价打压，所以e会进入市场。

3。结论：spe是e进入，I维持高价。

这显示了spe如何排除不可信威胁（即I宣称要降价，但实际上不会）。

(3）信号博弈（Jobmarketsigna1ing）

场景：

?求职者（orker）可以选择是否上大学（成本c）。

?雇主（emp1oyer）决定是否提供高薪（h）或低薪（L）。

?如果雇主认为求职者能力高，就提供高薪，否则提供低薪。

解法（逆向归纳法）：

笔趣阁

三千五中文网>职场小聪明 > 第476章子博弈完美均衡（第1页）