純化定理のソースを表示
←
純化定理
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
[[ゲーム理論]]における'''純化定理''' (じゅんかていり,{{lang-en-short|purification theorem}}) は,[[ノーベル経済学賞]][[ジョン・ハーサニ]]の 1973 年論文<ref>J.C. Harsanyi. 1973. "Games with randomly disturbed payoffs: a new rationale for mixed-strategy equilibrium points. ''Int. J. Game Theory'' 2 (1973), pp. 1–23.</ref>による貢献である.この定理は,[[混合戦略]][[ナッシュ均衡]]において,各プレーヤーは正確率で選ぶすべての行動について完全に無差別であるにもかかわらず,他のプレーヤーにとっても無差別にするためにそれらの行動を混合している,という不可解な側面について正当化することを狙ったものである. 混合戦略均衡は,各プレーヤーの利得が自分以外のプレーヤーには知られていないような[[不完備情報ゲーム|不完備情報]]の変動ゲームの,[[純粋戦略]][[ナッシュ均衡|均衡]]の極限として説明される.そのアイデアは,もとの理想化されたゲームを設計した理論家からは観察されないような,ゲームの漸次改善されていく近似として,もとのゲームで予測された混合戦略が生じてくるというものである. 戦略が外見的には混合されてみえる性質は,実際にはただ,プレーヤーがもつ利得の[[連続体濃度|連続体]]の上の[[事前確率|事前分布]]に依存して決まる閾値とあわせて純粋戦略をプレーするプレーヤーの結果である.この連続体が 0 に縮んでいくにつれて,プレーヤーたちの戦略は,もとの,変動していない[[完備情報ゲーム]]において予測されたナッシュ均衡に収束する. この結果は,[[進化ゲーム|進化ゲーム理論]]の今日の研究における重要な一面にもなっている.そこではこの変動する値は,ゲームをプレーする集団内で無作為にペアになるプレーヤーたちのタイプの上の分布と解釈されている. == 例 == {| class="wikitable" style="float: right; text-align: center; width: 200px;" |+ タカハトゲーム ! ! ''C'' ! ''D'' |- ! ''C'' | 3, 3 | 2, 4 |- ! ''D'' | 4, 2 | 0, 0 |} 右に示した[[チキンゲーム|タカ–ハトゲーム]]を考えよう.このゲームには 2 つの[[純粋戦略]]均衡,(''D'', ''C''), (''C'', ''D'') がある.また,両プレーヤーが ''C'' を確率 <math>\frac{2}{3}</math> でプレーする混合戦略均衡もある. 各プレーヤー ''i'' は,''C'' をプレーするために追加的なコスト ''a<sub>i</sub>'' を負担するとし,これは [−''A'', ''A''] 上の一様分布に従うとしよう.プレーヤーたちはこのコストについて,自分じしんの値だけを知っているとする.したがってこれは[[不完備情報ゲーム|不完備情報]]のゲームであり,[[ベイジアンゲーム#ベイジアン・ナッシュ均衡|ベイジアン・ナッシュ均衡]]で解くことになる. ''a<sub>i</sub>'' ≤ ''a''<sup>*</sup> となる確率は <math>{a^* + A \over 2A}</math> である.プレーヤー 2 は ''a''<sub>2</sub> ≤ ''a''<sup>*</sup> のときに ''C'' をとるものとすると,プレーヤー 1 が行動 ''C'' から得る期待利得は <math>-a_1 + 3 \cdot {a^* + A \over 2A} + 2 \left( 1 - {a^* + A \over 2A} \right)</math> となり,行動 ''D'' から得る期待利得は <math>4 \cdot {a^* + A \over 2A}</math> となる.したがってプレーヤー 1 は,<math>a_1 \le 2 - 3 \cdot {a^* + A \over 2A}</math> のときに行動 ''C'' をとるべきことになる.両プレーヤーが ''a<sub>i</sub>'' ≤ ''a''<sup>*</sup> のときに ''C'' を選ぶような対称均衡を求めるため,これを等式として <math>a^* = {1 \over 2 + 3 / A}</math> と解く. ''a''<sup>*</sup> の値がわかったので,各プレーヤーが ''C'' をとる確率を, : <math>\operatorname{Pr} (a_i \le a^*) = \frac{\displaystyle \frac{1}{2 + 3 / A} + A}{2A} = \frac{A}{4A^2 + 6A} + \frac{1}{2}</math> と計算することができる.ここで ''A'' → 0 とすると,この値は <math>\frac{2}{3}</math> に近づく.これは[[完備情報ゲーム]]においてとられた混合戦略の確率である. こうして,混合戦略は,プレーヤーたちが利得についてわずかな私的情報をもっているときにとられる純粋戦略の帰結であるとみなすことができる. == 技術的な詳細 == ハーサニの証明は,各プレーヤーに関する変動は他のプレーヤーからは独立であるという強い仮定を含んでいる.しかし,この定理をより一般的なものとするためのさらなる改良が試みられている<ref>R. Aumann, et al. 1983. "Approximate Purificaton of Mixed Strategies. ''Mathematics of Operations Research'' 8 (1983), pp. 327–341.</ref><ref>Govindan, S., Reny, P.J. and Robson, A.J. 2003. "A Short Proof of Harsanyi's Purification Theorem. ''Games and Economic Behavior'' v45,n2 (2003), pp.369-374.</ref>. 所与のゲームのすべての混合戦略均衡は,同一の変動ゲームの列を用いることで純化することができるというのが,定理の主要な結果である.しかしこのことは,変動の独立性に加えて,このゲームの列の利得の集合が [[測度論|full measure]] をもつということにもよっている.[[病的な (数学)|病的な]]性質のためにこの条件が成りたたないようなゲームも存在する. こうしたゲームにかかわる主要な問題は,次の 2 つのカテゴリのどちらかである: # いくつかの異なる混合戦略が,変動ゲームの異なる列によって純化される. # [[支配戦略|弱く支配される戦略]]を含む混合戦略が存在する. 弱く支配される戦略を含む混合戦略は,この方法を用いても「純化」することができない.というのも,この弱く支配される戦略が最適反応にならないような戦略を相手プレーヤーがプレーするという非負の確率があるときには,プレーヤーは決して弱く支配される戦略をとりたいとは思わないからである.こうして,不連続性を含むために,極限で成立しなくなってしまう<ref>Fudenberg, Drew and Jean Tirole: ''Game Theory'', MIT Press, 1991, pp. 233-234</ref>. == 参考文献 == <references /> {{ゲーム理論}} {{DEFAULTSORT:しゆんかていり}} [[Category:ゲーム理論]] [[Category:定理]] [[Category:数学に関する記事]]
このページで使用されているテンプレート:
テンプレート:Lang-en-short
(
ソースを閲覧
)
テンプレート:ゲーム理論
(
ソースを閲覧
)
純化定理
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報