fbpx
维基百科

无名氏定理

博弈论中,无名氏定理(英語:folk theorem)是一类描述重复博弈纳什均衡的定理。[1][註 1]起初,无名氏定理仅关注无穷博弈的纳什均衡。在1950年代,这类定理已经广受博弈论学者知晓,但并没有人发表它,所以称为无名氏定理。1971年发表的Friedman定理考虑了无穷博弈的一系列子博弈精炼纳什均衡英语Subgame perfect equilibrium(SPE),把定理的初始版本推广到了更强的均衡概念上。[2]

无名氏定理指出,如果参与者对未来足够有耐心(也即贴现因子),对于任意可行、满足个人理性假设的一组收益,都存在着一个子博弈精炼纳什均衡,使得第个参与者的平均收益就是[3]换言之,任何程度的合作(只要是可行的且满足个人理性)都可以通过一个子博弈精炼纳什均衡来达成。

例如,在只有一期的囚徒困境中,两个参与者都选择合作并非纳什均衡,唯一的纳什均衡就是两个人都选择背叛。根据无名氏定理,如果囚徒困境重复无穷多次,并且参与者足够有耐心,就会存在两个参与者都合作的纳什均衡。但在有限期囚徒困境中,最后一期一定会双方都背叛,从而倒数第二期双方也会背叛,以此类推,唯一的子博弈精炼纳什均衡就是双方一直背叛,不会有合作出现。

前提 编辑

重复博弈中的纳什均衡应该满足以下两个性质:

  • 个人理性:最终支付至少要大弱占优于参与者能得到的最大收益的最小值(即最小最大收益),否则他还不如选择最小最大化策略。
  • 可行性:最终支付必须是一系列可能策略的凸组合,因为重复博弈中参与者的最终支付就是单个博弈中收益的加权平均。

无名氏定理有若干种,有些考虑有限重复博弈,有些考虑无限重复博弈。[4]

不考虑贴现的无穷博弈 编辑

在不考虑贴现的无穷博弈中,参与者都是有耐心的。在任何时间点,相同的效用带来的收益都是相同的。所以在无穷博弈中,每个参与者的收益就等于每一期博弈获取效用的总和。

就无穷博弈而言,总收益的计算通常是平均效用取极限以后的下确界。假设第 期参与者 选择的行动是 ,那么他的总收益就是:

 

其中 表示每个阶段博弈中,参与者 的效用函数。

这种情况下,无名氏定理指出:阶段博弈中满足个人理性且可行的行动在无穷博弈中都是纳什均衡。

考虑冷酷战略英语Grim trigger。所有参与者都按照预定的策略进行每一期博弈。如果在某一期中有人没有使用预定策略,从下一期开始所有人永远选择让这个人只能拿到最小最大收益的策略。这样,出偏差的人的总收益也只能是最小最大收益,所以所有人都愿意按照预定策略行事。[5][6][7]:139[8]

子博弈精炼均衡 编辑

上述纳什均衡不一定是一个子博弈精炼均衡。如果实施惩罚对其他人的收益影响也很大,那么惩罚就是不可信的。

要想达到子博弈精炼均衡,每次有人偏离预定策略时,惩罚不应该一直实施下去,而只应持续到出偏差的人在那一期博弈带来的额外收益得到抵消为止。之后,大家依旧按照预定策略继续博弈。[5][7]:146–149

因为计算总收益的方法是平均收益取极限,所以有限期的惩罚并不会影响总收益。这样,这就是一个子博弈精炼纳什均衡。

考虑贴现的无穷博弈 编辑

设贴现因子 满足 ,无穷博弈的总收益为:

 

贴现因子的大小反映出参与者的耐心高低。

这种情况下的无名氏定理指出,每个人的总收益将严格大于最小最大收益。

注释 编辑

  1. ^ 数学中,“无名氏定理”一词通常表示人们普遍同意,且已经经过讨论却未曾发表的定理。为了让名字更直白一些,Roger Myerson推荐把这类定理叫做“一般可行性定理”(英語:general feasibility theorem),参见Myerson, Roger B. Game Theory, Analysis of conflict, Cambridge, Harvard University Press (1991)

参考文献 编辑

  1. ^ Friedman, J., A non-cooperative equilibrium for supergames, Review of Economic Studies, 1971, 38 (1): 1–12, JSTOR 2296617, doi:10.2307/2296617 
  2. ^ R. Gibbons. A Primer in Game Theory. Harvester Wheatsheaf. 1992: 89. ISBN 0-7450-1160-8. 
  3. ^ Jonathan Levin. Bargaining and Repeated Games (PDF). 2002 [2018-05-05]. (原始内容 (PDF)于2020-11-27). 
  4. ^ Michael Maschler, Eilon Solan & Shmuel Zamir. Game Theory. Cambridge University Press. 2013: 176–180. ISBN 978-1-107-00548-8. 
  5. ^ 5.0 5.1 Aumann, Robert J.; Shapley, Lloyd S. Long-Term Competition—A Game-Theoretic Analysis. Essays in Game Theory. 1994: 1. ISBN 978-1-4612-7621-0. doi:10.1007/978-1-4612-2648-2_1. 
  6. ^ Rubinstein, Ariel. Equilibrium in supergames with the overtaking criterion. Journal of Economic Theory. 1979, 21: 1. doi:10.1016/0022-0531(79)90002-4. 
  7. ^ 7.0 7.1 . ISBN 0-262-15041-7. LCCN 94008308. OL 1084491M.  缺少或|title=为空 (帮助)
  8. ^ Rubinstein, A. Strong perfect equilibrium in supergames. International Journal of Game Theory. 1980, 9: 1. doi:10.1007/BF01784792. 

无名氏定理, 在博弈论中, 英語, folk, theorem, 是一类描述重复博弈纳什均衡的定理, 起初, 仅关注无穷博弈的纳什均衡, 在1950年代, 这类定理已经广受博弈论学者知晓, 但并没有人发表它, 所以称为, 1971年发表的friedman定理考虑了无穷博弈的一系列子博弈精炼纳什均衡, 英语, subgame, perfect, equilibrium, 把定理的初始版本推广到了更强的均衡概念上, 指出, 如果参与者对未来足够有耐心, 也即贴现因子δ, displaystyle, delta, 对于任. 在博弈论中 无名氏定理 英語 folk theorem 是一类描述重复博弈纳什均衡的定理 1 註 1 起初 无名氏定理仅关注无穷博弈的纳什均衡 在1950年代 这类定理已经广受博弈论学者知晓 但并没有人发表它 所以称为无名氏定理 1971年发表的Friedman定理考虑了无穷博弈的一系列子博弈精炼纳什均衡 英语 Subgame perfect equilibrium SPE 把定理的初始版本推广到了更强的均衡概念上 2 无名氏定理指出 如果参与者对未来足够有耐心 也即贴现因子d 1 displaystyle delta to 1 对于任意可行 满足个人理性假设的一组收益v v 1 v n displaystyle v v 1 cdots v n 都存在着一个子博弈精炼纳什均衡 使得第i displaystyle i 个参与者的平均收益就是v i displaystyle v i 3 换言之 任何程度的合作 只要是可行的且满足个人理性 都可以通过一个子博弈精炼纳什均衡来达成 例如 在只有一期的囚徒困境中 两个参与者都选择合作并非纳什均衡 唯一的纳什均衡就是两个人都选择背叛 根据无名氏定理 如果囚徒困境重复无穷多次 并且参与者足够有耐心 就会存在两个参与者都合作的纳什均衡 但在有限期囚徒困境中 最后一期一定会双方都背叛 从而倒数第二期双方也会背叛 以此类推 唯一的子博弈精炼纳什均衡就是双方一直背叛 不会有合作出现 目录 1 前提 2 不考虑贴现的无穷博弈 2 1 子博弈精炼均衡 3 考虑贴现的无穷博弈 4 注释 5 参考文献前提 编辑重复博弈中的纳什均衡应该满足以下两个性质 个人理性 最终支付至少要大弱占优于参与者能得到的最大收益的最小值 即最小最大收益 否则他还不如选择最小最大化策略 可行性 最终支付必须是一系列可能策略的凸组合 因为重复博弈中参与者的最终支付就是单个博弈中收益的加权平均 无名氏定理有若干种 有些考虑有限重复博弈 有些考虑无限重复博弈 4 不考虑贴现的无穷博弈 编辑在不考虑贴现的无穷博弈中 参与者都是有耐心的 在任何时间点 相同的效用带来的收益都是相同的 所以在无穷博弈中 每个参与者的收益就等于每一期博弈获取效用的总和 就无穷博弈而言 总收益的计算通常是平均效用取极限以后的下确界 假设第t displaystyle t nbsp 期参与者i displaystyle i nbsp 选择的行动是x t displaystyle x t nbsp 那么他的总收益就是 U i lim T inf 1 T t 0 T u i x t displaystyle U i lim T to infty inf frac 1 T sum t 0 T u i x t nbsp dd 其中u i displaystyle u i nbsp 表示每个阶段博弈中 参与者i displaystyle i nbsp 的效用函数 这种情况下 无名氏定理指出 阶段博弈中满足个人理性且可行的行动在无穷博弈中都是纳什均衡 考虑冷酷战略 英语 Grim trigger 所有参与者都按照预定的策略进行每一期博弈 如果在某一期中有人没有使用预定策略 从下一期开始所有人永远选择让这个人只能拿到最小最大收益的策略 这样 出偏差的人的总收益也只能是最小最大收益 所以所有人都愿意按照预定策略行事 5 6 7 139 8 子博弈精炼均衡 编辑 上述纳什均衡不一定是一个子博弈精炼均衡 如果实施惩罚对其他人的收益影响也很大 那么惩罚就是不可信的 要想达到子博弈精炼均衡 每次有人偏离预定策略时 惩罚不应该一直实施下去 而只应持续到出偏差的人在那一期博弈带来的额外收益得到抵消为止 之后 大家依旧按照预定策略继续博弈 5 7 146 149因为计算总收益的方法是平均收益取极限 所以有限期的惩罚并不会影响总收益 这样 这就是一个子博弈精炼纳什均衡 考虑贴现的无穷博弈 编辑设贴现因子d displaystyle delta nbsp 满足0 lt d lt 1 displaystyle 0 lt delta lt 1 nbsp 无穷博弈的总收益为 U i 1 d t 0 d t u i x t displaystyle U i 1 delta sum t geq 0 delta t u i x t nbsp 贴现因子的大小反映出参与者的耐心高低 这种情况下的无名氏定理指出 每个人的总收益将严格大于最小最大收益 注释 编辑 数学中 无名氏定理 一词通常表示人们普遍同意 且已经经过讨论却未曾发表的定理 为了让名字更直白一些 Roger Myerson推荐把这类定理叫做 一般可行性定理 英語 general feasibility theorem 参见Myerson Roger B Game Theory Analysis of conflict Cambridge Harvard University Press 1991 参考文献 编辑 Friedman J A non cooperative equilibrium for supergames Review of Economic Studies 1971 38 1 1 12 JSTOR 2296617 doi 10 2307 2296617 R Gibbons A Primer in Game Theory Harvester Wheatsheaf 1992 89 ISBN 0 7450 1160 8 Jonathan Levin Bargaining and Repeated Games PDF 2002 2018 05 05 原始内容存档 PDF 于2020 11 27 Michael Maschler Eilon Solan amp Shmuel Zamir Game Theory Cambridge University Press 2013 176 180 ISBN 978 1 107 00548 8 5 0 5 1 Aumann Robert J Shapley Lloyd S Long Term Competition A Game Theoretic Analysis Essays in Game Theory 1994 1 ISBN 978 1 4612 7621 0 doi 10 1007 978 1 4612 2648 2 1 Rubinstein Ariel Equilibrium in supergames with the overtaking criterion Journal of Economic Theory 1979 21 1 doi 10 1016 0022 0531 79 90002 4 7 0 7 1 ISBN 0 262 15041 7 LCCN 94008308 OL 1084491M 缺少或 title 为空 帮助 Rubinstein A Strong perfect equilibrium in supergames International Journal of Game Theory 1980 9 1 doi 10 1007 BF01784792 取自 https zh wikipedia org w index php title 无名氏定理 amp oldid 69235398, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。