Ε均衡のソースを表示
←
Ε均衡
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
{{小文字}} [[ゲーム理論]]において '''ε 均衡''' (イプシロンきんこう,epsilon-equilibrium) または'''近似ナッシュ均衡''' (near-Nash equilibrium) とは,[[ナッシュ均衡]]の条件を近似的にみたすような[[戦略#ゲーム理論における戦略|戦略]]プロファイルのことである. == 定義 == ゲームと非負の実数 ε とを所与として,戦略プロファイルが ε 均衡であるとは,どのプレーヤーにとっても,自分の戦略からの単独での逸脱によって,期待利得を ε より大きく改善することができないことをいう.任意の[[ナッシュ均衡]]は,ε = 0 の場合の ε 均衡に等しい. 形式的に書こう.''N'' 人のプレーヤーがいて,各プレーヤーの行動集合が <math>A_i</math>, 効用関数が ''u'' であるようなゲームを <math>G = (N, A = A_1 \times \cdots \times A_N, u: A \to \reals^N)</math> とする.戦略の組 <math>\sigma \in \Delta = \Delta_1 \times \cdots \times \Delta_N</math> が ''G'' の ε 均衡であるとは, : <math>u_i (\sigma) \geq u_i (\sigma_i', \sigma_{-i}) - \varepsilon \; \mbox{for all} \; \sigma_i' \in \Delta_i, i \in N</math> であるときをいう. == 例 == ε 均衡の概念は,無限に継続する可能性のある[[確率ゲーム]]の理論において重要である.[[ナッシュ均衡]]が存在しないが,0 より厳密に大きい任意の ε について ε 均衡が存在するような,簡単な確率ゲームの例がある. おそらくもっとも簡単な例は,[[ヒュー・エヴェレット3世|エヴェレット]]により提案された,次のような[[マッチングペニー]]の変種だろう.プレーヤー 1 はペニー硬貨を隠し,プレーヤー 2 はそれが表か裏かを推測する.プレーヤー 2 が正しく当てたならば,プレーヤー 1 からペニーをもらってゲームが終了する.プレーヤー 2 が,表と推測して外したならば,両プレーヤーの利得を 0 としてゲームが終了する.プレーヤー 2 が裏と推測して外したならば,ゲームは'''繰りかえす'''.もしゲームが永久に続くならば,両プレーヤーの利得は 0 になる. パラメータ ε > 0 を所与として,プレーヤー 2 が,(ゲームのステージによらず,それ以前のステージとも独立に) 表を確率 ε, 裏を確率 1 − ε と推測するような任意の戦略プロファイルは,このゲームの ε 均衡になる.このような戦略プロファイルにおけるプレーヤー 2の 期待利得は少なくとも 1 − ε になる.しかし,ちょうど 1 の期待利得を保証するようなプレーヤー 2 の戦略は存在しないことが簡単にわかる.したがって,このゲームは[[ナッシュ均衡]]をもたない. べつの簡単な例として,''T'' 期間の有限回[[繰り返しゲーム|繰りかえし]][[囚人のジレンマ]]を考え,利得は ''T'' 期間の平均で与えられるものとしよう.このゲームの唯一の[[ナッシュ均衡]]は,各期において裏切りを選ぶというものである.ここで,2 つの戦略,[[しっぺ返し戦略]]と[[トリガー戦略|グリムトリガー]]を考えよう.しっぺ返しもグリムトリガーもこのゲームのナッシュ均衡にならないが,どちらもある正なる ε について ε 均衡になる.ε の許容される値は,ステージゲーム利得と繰りかえしの期間数 ''T'' に依存する. [[経済学]]において,[[純粋戦略]] ε 均衡の概念は,[[混合戦略]]によるアプローチが現実的でないとみなされるときに使われている.純粋戦略 ε 均衡においては,各プレーヤーは,最適な純粋戦略から ε 以内だけ離れた純粋戦略を選択する.例として,{{仮リンク|ベルトラン・エッジワースモデル|en|Bertrand–Edgeworth model}}においては,純粋戦略均衡は存在しないが,純粋戦略 ε 均衡は存在しうる. == 参考文献== *Dixon, H [http://ideas.repec.org/a/bla/restud/v54y1987i1p47-62.html Approximate Bertrand Equilibrium in a Replicated Industry], Review of Economic Studies, 54 (1987), pages 47-62. *H. Everett. "Recursive Games". In H.W. Kuhn and A.W. Tucker, editors. ''Contributions to the theory of games'', vol. III, volume 39 of ''Annals of Mathematical Studies''. Princeton University Press, 1957. * {{Citation | last2=Shoham | first2=Yoav | last1=Leyton-Brown | first1=Kevin | title=Essentials of Game Theory: A Concise, Multidisciplinary Introduction | publisher=Morgan & Claypool Publishers | isbn=978-1-59829-593-1 | url=http://www.gtessentials.org | year=2008 | location=San Rafael, CA}}. An 88-page mathematical introduction; see Section 3.7. [http://www.morganclaypool.com/doi/abs/10.2200/S00108ED1V01Y200802AIM003 Free online] at many universities. *R. Radner. ''Collusive behavior in non-cooperative epsilon equilibria of oligopolies with long but finite lives'', Journal of Economic Theory, '''22''', 121-157, 1980. * {{Citation | last1=Shoham | first1=Yoav | last2=Leyton-Brown | first2=Kevin | title=Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations | publisher=[[Cambridge University Press]] | isbn=978-0-521-89943-7 | url=http://www.masfoundations.org | year=2009 | location=New York}}. A comprehensive reference from a computational perspective; see Section 3.4.7. [http://www.masfoundations.org/download.html Downloadable free online]. *S.H. Tijs. ''Nash equilibria for noncooperative n-person games in normal form'', Siam Review, '''23''', 225-237, 1981. {{ゲーム理論}} {{DEFAULTSORT:いふしろんきんこう}} [[Category:ゲーム理論]] [[Category:数学に関する記事]]
このページで使用されているテンプレート:
テンプレート:Citation
(
ソースを閲覧
)
テンプレート:ゲーム理論
(
ソースを閲覧
)
テンプレート:仮リンク
(
ソースを閲覧
)
テンプレート:小文字
(
ソースを閲覧
)
Ε均衡
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報