fbpx
维基百科

信号博弈

信號博弈(英語:signaling game),是一種由一個發送者(S)和另一個接收者(R)所組成的動態博弈。一開始這個發送者有一個給定的類型(t),接著發送者會觀察這個沒有其他人(好比說接收者)知道的類型,去從訊息堆 M = {m1, m2, m3,..., mj} 中選擇送出一個訊息(m),接著接收者會觀察這個訊息後從他可行的動作中 A = {a1, a2, a3,...., ak} 選一個作為反應動作(a),這裡要注意的是接收者除了訊息之外其他都無法得知(如發送者的類型t),接著根據(t, m, a)的組合來決定雙方會獲得的報酬或回報。

精炼贝叶斯均衡 编辑

每种类型的发送者发送的消息都满足消息集合M中的概率分布,设 表示 类型的发送者发送M中任意消息的概率。接收者观察到消息m后作出的反应动作 也满足行动集合A中的概率分布。

精炼贝叶斯均衡需要满足下面四个条件:

  • 接收者知道对任意的消息m,哪些类型的发送者会发送m。也即他知道发送m的发送者属于 类型的概率 ,这个概率对所有类型 求和应该等于1。
  • 接收者选择的行动应该按照他对上一个条件的认知 最大化他的预期效用,即选择适当的行动,使得 最大化。记这个最大化预期效用的行动为 
  • 根据上述条件确定的接收者策略 ,对每种类型 ,发送者选择的消息 应该最大化发送者的预期效用 
  • 对发送者可能发送的每种消息 ,如果至少存在一种类型 使得 等于 的概率严格大于零(即至少存在一种类型的发送者可能会发送消息m),那么接收者收到消息 之后认为发送者属于t类型的后验概率 满足贝叶斯定理 

信号博弈, 本條目存在以下問題, 請協助改善本條目或在討論頁針對議題發表看法, 此條目需要擴充, 2011年3月12日, 请協助改善这篇條目, 更進一步的信息可能會在討論頁或扩充请求中找到, 请在擴充條目後將此模板移除, 此條目需要精通或熟悉相关主题的编者参与及协助编辑, 2011年3月12日, 請邀請適合的人士改善本条目, 更多的細節與詳情請參见討論頁, 此條目過於依赖第一手来源, 2011年3月12日, 请補充第二手及第三手來源, 以改善这篇条目, 此條目没有列出任何参考或来源, 2011年3月12日, 維基百. 本條目存在以下問題 請協助改善本條目或在討論頁針對議題發表看法 此條目需要擴充 2011年3月12日 请協助改善这篇條目 更進一步的信息可能會在討論頁或扩充请求中找到 请在擴充條目後將此模板移除 此條目需要精通或熟悉相关主题的编者参与及协助编辑 2011年3月12日 請邀請適合的人士改善本条目 更多的細節與詳情請參见討論頁 此條目過於依赖第一手来源 2011年3月12日 请補充第二手及第三手來源 以改善这篇条目 此條目没有列出任何参考或来源 2011年3月12日 維基百科所有的內容都應該可供查證 请协助補充可靠来源以改善这篇条目 无法查证的內容可能會因為異議提出而被移除 信號博弈 英語 signaling game 是一種由一個發送者 S 和另一個接收者 R 所組成的動態博弈 一開始這個發送者有一個給定的類型 t 接著發送者會觀察這個沒有其他人 好比說接收者 知道的類型 去從訊息堆 M m1 m2 m3 mj 中選擇送出一個訊息 m 接著接收者會觀察這個訊息後從他可行的動作中 A a1 a2 a3 ak 選一個作為反應動作 a 這裡要注意的是接收者除了訊息之外其他都無法得知 如發送者的類型t 接著根據 t m a 的組合來決定雙方會獲得的報酬或回報 精炼贝叶斯均衡 编辑每种类型的发送者发送的消息都满足消息集合M中的概率分布 设m t j displaystyle m t j nbsp 表示t j displaystyle t j nbsp 类型的发送者发送M中任意消息的概率 接收者观察到消息m后作出的反应动作a m displaystyle a m nbsp 也满足行动集合A中的概率分布 精炼贝叶斯均衡需要满足下面四个条件 接收者知道对任意的消息m 哪些类型的发送者会发送m 也即他知道发送m的发送者属于t i displaystyle t i nbsp 类型的概率m t i m displaystyle mu t i m nbsp 这个概率对所有类型t i displaystyle t i nbsp 求和应该等于1 接收者选择的行动应该按照他对上一个条件的认知m t i m displaystyle mu t i m nbsp 最大化他的预期效用 即选择适当的行动 使得 t i m t i m U R t i m a displaystyle sum t i mu t i m U R t i m a nbsp 最大化 记这个最大化预期效用的行动为a m displaystyle a m nbsp 根据上述条件确定的接收者策略a displaystyle a nbsp 对每种类型t displaystyle t nbsp 发送者选择的消息m displaystyle m nbsp 应该最大化发送者的预期效用U S t m a m displaystyle U S t m a m nbsp 对发送者可能发送的每种消息m displaystyle m nbsp 如果至少存在一种类型t displaystyle t nbsp 使得m t displaystyle m t nbsp 等于m displaystyle m nbsp 的概率严格大于零 即至少存在一种类型的发送者可能会发送消息m 那么接收者收到消息m displaystyle m nbsp 之后认为发送者属于t类型的后验概率m t m displaystyle mu t m nbsp 满足贝叶斯定理 m t m p t t i p t i displaystyle mu t m p t sum t i p t i nbsp 取自 https zh wikipedia org w index php title 信号博弈 amp oldid 73167088, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。