摂動完全均衡のソースを表示

[[File:Reinhard Selten2.jpg|thumb|200px|ラインハルト・ゼルテン (2001 年撮影)]]
'''摂動完全均衡''' (せつどうかんぜんきんこう，[[:en:Trembling hand perfect equilibrium|英]]: trembling hand perfect equilibrium, [[:de:Trembling-hand-perfektes Gleichgewicht|独]]: trembling-hand-perfektes Gleichgewicht) とは，[[ナッシュ均衡]]の精緻化のひとつ．1975 年に ''International Journal of Game Theory'' 誌に掲載された論文において，“A Model of Slight Mistakes” (軽微な誤りのモデル) の名前で，[[ラインハルト・ゼルテン]]によってこの概念が発見された．ここでの狙いは，均衡はプレーヤーたちの誤りによってどの程度影響されるかを決定することである．ゼルテンによれば，プレーヤーたちが完全に合理的に行動するならば，誤りは起こらない．しかし現実では，人びとは相手のプレーヤーの誤った決定を計算に入れねばならない．この点をゲーム理論的に表現するために，摂動完全均衡が生みだされた<ref>{{cite journal | author= Reinhard Selten |title= A reexamination of the perfectness concept for equilibrium points in extensive games |journal= International Journal of Game Theorie | publisher= Physica-Verlag | place= Vienna | year= 1975 | pages= 25 - 55 }} S.35</ref>．

== アプローチの簡単な説明 ==
簡単な表現で'''摂動完全均衡'''のアイデアを説明しよう．プレーヤー A が，プレーヤー B はかならず[[戦略 (ゲーム理論)|戦略]] ''b''<sub>1</sub> をとってくると考えているとして，その ''b''<sub>1</sub> へのプレーヤー A の最適反応は戦略 ''a''<sub>1</sub> であるとしよう．戦略 ''a''<sub>1</sub> をプレーすることは，もしプレーヤー B が小さな誤り確率 ε で ''b''<sub>2</sub> をプレーしてくるとしても，なお最適な選択でありつづけるだろうか．そのような条件でもなお ''a''<sub>1</sub> がプレーヤー A の最適戦略であるならば，これは摂動完全均衡戦略であるという．

== 正規形ゲームにおける摂動完全均衡 ==
{| class="wikitable" style="float: right; clear: right;"
 ! A＼B
 ! ''b''<sub>1</sub>
 ! ''b''<sub>2</sub>
 |-
 ! ''a''<sub>1</sub>
 | (3, 3)
 | (5, 0)
 |-
 ! ''a''<sub>2</sub>
 | (-2, -2)
 | (5, 0)
 |-
 |}

右の利得行列をもつ[[標準型ゲーム|正規形ゲーム]]によって，'''摂動完全均衡'''のアプローチが非常に簡単に説明できる．

この例における 2 つの[[ナッシュ均衡]]は (''a''<sub>1</sub>, ''b''<sub>1</sub>) と (''a''<sub>2</sub>, ''b''<sub>2</sub>) である．このどちらが (あるいは両方が) 摂動完全均衡であるかを検討しよう．プレーヤー A は戦略 ''a''<sub>1</sub> をプレーしたいと思い，かつプレーヤー B は戦略 ''b''<sub>1</sub> をプレーするとすると，両者は 3 の利得を得ることになる．しかしプレーヤー A が，プレーヤー B は小さな誤り確率で戦略 ''b''<sub>2</sub> をプレーしてこないともかぎらないというふうに不確かに思う．''a''<sub>1</sub> が，このプレーヤー 2 の誤り確率があってもなおプレーヤー 1 の最適な選択であり，したがって摂動完全である，ということを確かめるには，次のことを確認しなければならない：プレーヤー 1 が ''a''<sub>1</sub> を選んだときの[[期待値|期待利得]]が，''a''<sub>2</sub> を選んだときの期待利得以上である．

ε をプレーヤー B の誤り確率とし，これは非常に小さいものと仮定する．すなわち，その余事象の確率 (正しくプレーする確率) が 1 − ε である．ここで 0 < ε < 1 とする．

すると，''a''<sub>1</sub> を選んだときのプレーヤー 1 の期待利得は，
: <math>\begin{align}
\mathrm E [u (a_1)] & = (1 - \varepsilon) u (a_1, b_1) + \varepsilon u (a_1, b_2) \\
 & = (1 - \varepsilon) \cdot 3 + \varepsilon \cdot 5
\end{align}</math>
であり，反対に，戦略 ''a''<sub>2</sub> からの期待利得は，
: <math>\begin{align}
\mathrm E [u (a_2)] & = (1 - \varepsilon) u (a_2, b_1) + \varepsilon u (a_2, b_2) \\
 & = (1 - \varepsilon) \cdot (-2) + \varepsilon \cdot 5
\end{align}</math>
である．次のことが簡単にわかる：
: <math>(1 - \varepsilon) \cdot 3 + \varepsilon \cdot 5 > (1 - \varepsilon) \cdot (-2) + \varepsilon \cdot 5</math>.

また，プレーヤー B が小さな誤り確率で ''b''<sub>2</sub> をプレーするならば，プレーヤー 1 にとって ''a''<sub>1</sub> は最適な選択である．したがって，戦略 ''a''<sub>1</sub> は摂動完全である．しかし，摂動完全均衡は 2 つの摂動完全な戦略の組みあわせからなるものである．したがって，戦略プロファイル (''a''<sub>1</sub>, ''b''<sub>1</sub>) が摂動完全均衡であることを示すには，プレーヤー 2 の ''b''<sub>1</sub> についても確かめなければならない．戦略 ''a''<sub>1</sub> のときと同様に，次のことが示される．

''b''<sub>1</sub> を選んだときのプレーヤー 2 の期待利得は，
: <math>\begin{align}
\mathrm E [u (b_1)] & = (1 - \varepsilon) u (a_1, b_1) + \varepsilon u (a_2, b_1) \\
 & = (1 - \varepsilon) \cdot 3 + \varepsilon \cdot (-2)
\end{align}</math>
であり，反対に，戦略 ''b''<sub>2</sub> からの期待利得は，
: <math>\begin{align}
\mathrm E [u (b_2)] & = (1 - \varepsilon) u (a_1, b_2) + \varepsilon u (a_2, b_2) \\
 & = (1 - \varepsilon) \cdot 0 + \varepsilon \cdot 0
\end{align}</math>
である．ふたたび，明らかに，
: <math>0 < (1 - \varepsilon) \cdot 3 + \epsilon \cdot (-2) = 3 - 5 \cdot \varepsilon</math>.

したがって戦略 ''b''<sub>1</sub> も摂動完全であり，[[ナッシュ均衡]] (''a''<sub>1</sub>, ''b''<sub>1</sub>) は摂動完全均衡である<ref>{{cite book | author= Thomas Riechmann |title= Spieltheorie | publisher= Vahlen | place= München | year= 2010 | edition= 3 }} S.38-40</ref>．

== 変動ゲームを用いた形式的な定義 ==
=== 変動ゲームの簡単な定義 ===
'''変動ゲーム''' (perturbed game, perturbiertes Spiel) とは，もとになるゲームのコピーであって，どのプレーヤーもすべての[[純粋戦略]]を正の[[確率]]でプレーしなければならないという制限を加えたものである．すなわち，ふつうのゲームではプレーヤー A は自分の戦略を 0 ≤ ε ≤ 1 でプレーすることができるところ，変動ゲームでは ε > 0 でなければならない．

=== 形式的な定義 ===
次の戦略形ゲームから始める：
: <math>G = \langle I, (M_i)_{i \in I}, (P_i)_{i \in I} \rangle</math>.

ここで ''I'' はプレーヤーの集合を表し，''M<sub>i</sub>'' は純粋戦略 ''S<sub>i</sub>'' 上の確率分布からなる混合戦略の集合，そして ''P<sub>i</sub>'' はプレーヤー ''i'' の期待利得関数である．

プレーヤーの起こしうる誤りを描くための中心的なアイデアは，どの純粋戦略も 0 でない確率でプレーされうる，と仮定することである．そのような変動ゲームでは，''n<sub>i</sub>'' 個の純粋戦略をもった各プレーヤー ''i'' ∈ ''I'' について，<math>\varepsilon_i = (\varepsilon_i^1, \varepsilon_i^2,...,\varepsilon_i^{n_i})</math> を，正の確率の集合であって次をみたすものとする：<math>\varepsilon_i \gg 0, \; \sum_{j = 1}^{n_i} \varepsilon_i^j < 1</math>.

したがって，変動ゲームにおける混合戦略の集合は，
: <math>M_i^\varepsilon = \{ m_i \in M_i \mid m_i^k \ge \varepsilon_i^k, k = 1, \ldots, n_i \}</math>,
すなわち，プレーヤー ''i'' ∈ ''I'' はその ''k'' 番めの戦略について，少なくとも <math>\varepsilon_i^k</math> の確率でプレーしなければならないようなものである．以上から，変動ゲームは，
: <math>G (\varepsilon) = \langle I, (M_i^\varepsilon)_{i \in I}, (P_i)_{i \in I} \rangle</math>
となる．

変動ゲームにおけるナッシュ均衡を ''m''<sup>*</sup> (ε) とし，極限ゲームでのナッシュ均衡を ''m''<sup>*</sup> とする．変動ゲームにおける誤り確率 ε を 0 に近づけていき，それによって変動ゲームにおける均衡がもとの正規形ゲームにおけるものに一致するならば，これを'''摂動完全均衡'''であるという．形式的に表現すると，
: <math>\lim_{\varepsilon \to 0} m^* (\varepsilon) = m^*</math>
であるとき，摂動完全均衡であるという<ref>{{cite book | author= Jürgen Eichberger |title= Game Theorie for Economists | publisher= Emerald | place= Bingley | year= 2007 | edition= 1 }} S.111 - 113</ref>．

=== 例 ===
{| class="wikitable" style="float: right; clear: right;"
 ! A＼B
 ! ''b''<sub>1</sub>
 ! ''b''<sub>2</sub>
 |-
 ! ''a''<sub>1</sub>
 | (3, 3)
 | (0, 0)
 |-
 ! ''a''<sub>2</sub>
 | (0, 0)
 | (0, 0)
 |-
 |}

はじめのゲームとして，右の利得行列をもつ正規形ゲームを考える．

正規形ゲームでは 2 つの[[ナッシュ均衡]]戦略プロファイル，(''a''<sub>1</sub>, ''b''<sub>1</sub>), (''a''<sub>2</sub>, ''b''<sub>2</sub>) がある．ここでは両プレーヤーにとって，それぞれの相手のプレーヤーの選ぶ戦略に対して相互に最適になっている．

変動ゲームにおいてはそれは成りたたない．プレーヤー B が戦略 ''b''<sub>1</sub> を選ぶ確率が0より大ならば，プレーヤー A にとっての最適反応は確率 ''a''<sub>1</sub> = 1 でプレーすることである．変動ゲームでは定義によってこの確率は存在するので，プレーヤー A はかならず ''a''<sub>1</sub> = 1 をプレーすることになる．しかしプレーヤー A も変動ゲームでは戦略 ''a''<sub>2</sub> を正の確率でプレーしなければならない．したがってプレーヤー A の最適反応は，[[混合戦略]] <math>a_2 = a_2^{\rm min}</math>, すなわち ''a''<sub>2</sub> を最小限の確率でプレーすることである．

ゲームの対称性から，プレーヤー B にとっての最適戦略は，同様に <math>b_2 = b_2^{\rm min}</math> となる．

したがって，変動ゲームにおける均衡は，
: <math>(1 - a_2^{\rm min}, a_2^{\rm min}), (1 - b_2^{\rm min}, b_2^{\rm min})</math> <ref>{{cite book | author= Thomas Riechmann |title= Spieltheorie | publisher= Vahlen | place= München | year= 2010 | edition= 3 }} S.94 - 95</ref>.

いま，<math>a_2^{\rm min}</math> と <math>b_2^{\rm min}</math> を 0 に近づけたならば，変動ゲームから得られるのはふたたびもとのゲームにほかならない：
: <math>\lim_{a_2^{\rm min}, b_2^{\rm min} \to 0} \left( (1 - a_2^{\rm min}, a_2^{\rm min}), (1 - b_2^{\rm min}, b_2^{\rm min}) \right) = ((1, 0), (1, 0)) = (a_1, b_1)</math>

誤り確率を 0 に近づけ，変動ゲームの均衡がもとのゲームの[[ナッシュ均衡]]に近づくならば，この均衡は摂動完全均衡である．

この例では，変動ゲームは均衡 (''a''<sub>1</sub>, ''b''<sub>1</sub>) に向かい，したがってこれは摂動完全均衡である．

== 逐次手番ゲームにおける摂動完全均衡 ==
[[File:Spielbaum eines Extensivformspiels zweier Spieler.png|thumb|400px|2 人プレーヤーの展開形ゲームのゲームツリー]]

逐次手番ゲームに対しても，摂動完全均衡の概念を応用できる．[[標準型ゲーム|正規形ゲーム]]の場合と同じようにこの場合も，[[部分ゲーム完全均衡]]からのふるいわけには，小さな誤り確率があっても残るものを探しだすことが有用である．

=== 例 ===
右のものには 4 つの[[部分ゲーム完全均衡]]がある．(''A'', (''X'', ''X'')), すなわち，プレーヤー 1 は戦略 ''A'' をプレーし，プレーヤー 2 は，プレーヤー 1 が ''A'' を選んだならば ''X'' を，プレーヤー 1 が ''B'' を選んだときにも ''X'' を選ぶようなものである．ほかの 3 つの部分ゲーム完全均衡は，(''A'', (''Y'', ''X'')), (''B'', (''X'', ''X'')), (''B'', (''Y'', ''X'')).

このうち，プレーヤー 1 が戦略 ''A'' を選んでいるような 2 つの均衡だけが摂動完全である．プレーヤー 2 が戦略 ''Y'' をプレーする確率は十分小さいのだとしても，プレーヤー 1 にとってはやはり ''A'' をプレーすることがよりよい．というのもそうすればかならず 2 の利得が得られ，戦略 ''B'' を選んだ場合には戦略 ''A'' による場合よりも決してよい結果にはならないからである．

したがって，摂動完全均衡は (''A'', (''X'', ''X'')) と (''A'', (''Y'', ''X'')) の 2 つになる<ref>{{cite book | author= Thomas Riechmann |title= Spieltheorie | publisher= Vahlen | place= München | year= 2010 | edition= 3 }} S.53</ref>．

== エージェント標準形の展開形ゲームにおける摂動完全均衡 ==
<!--お気づきの方へ．以下 3 ヵ所にある „Dalekspiel“ をどう訳せばよいかわかりません．また „vom ... Kohlberg“ とありますが，ツリーはおそらく Kohlberg and Mertens (1986), p. 1008 の Figure 3 で利得の数字をいじったものであり，クレジットを Kohlberg に帰する出典もよくわかりません．-->
[[File:Kohlbergs Dalekspiel.png|thumb|400px|エロン・コールベルグの Dalekspiel の展開形表現]]

ゲーム理論家エロン・コールベルグによるもので，ここでわずかな修正を施した Dalekspiel が，摂動完全均衡のさらなる応用の例になる．[[展開型ゲーム|展開形ゲーム]]を[[標準型ゲーム|正規形ゲーム]]に還元するさいに起こる情報の減少を補うため，1953 年の論文で[[ハロルド・クーン]]は'''エージェント標準形''' (Agentennormalform) を用いた．右に示した Dalekspiel において，プレーヤー 1 は，それぞれの決定節で相関のない意思決定をするよう数学的に記述するために，2 人のエージェントに分割される<ref>{{cite journal | author= Harold William Kuhn |title= Extensive Games and the Problem of Informations |journal= Contribution to the Theory of Games, Vol. 2 | publisher= Princeton Univ. Press | place= Princeton | year= 1953 | pages= 193 - 216 }}</ref>．

{| class="wikitable" style="float: right; clear: right;"
 ! 1＼2
 ! ''L''
 ! ''R''
 |-
 ! ''gl''
 | (2, 5)
 | (2, 5)
 |-
 ! ''gr''
 | (2, 5)
 | (2, 5)
 |-
 ! ''ul''
 | (4, 1)
 | (0, 0)
 |-
 ! ''ur''
 | (0, 0)
 | (1, 4)
 |}

正規形では，純粋戦略の範囲で (''gl'', ''R''), (''gr'', ''R''), (''ul'', ''L'') という 3 つの[[ナッシュ均衡]]があることが簡単にわかる．いまこれらの均衡が摂動完全であるかを確かめるためには，プレーヤー 1 の 2 つの決定節における誤り確率が相互に相関していないことを保証せねばならない．すなわち，最初の決定節における誤りが，第 2 の決定節における確率を高めたり低めたりしてはならない．このことを保証するため，プレーヤー 1 は，右に示したように，独立して決定を行う 2 人のエージェントに分割されている．

ここで，次のように仮定する：
* 第 1 のエージェント (Sp1A) は，小さな誤り確率 ε で，''g'' でなく ''u'' をプレーしてしまう．
* 同様に，第 2 のエージェント (Sp1B) は，小さな誤り確率 δ で，''r'' でなく ''l'' をプレーしてしまう．
* 最後に，プレーヤー 2 は，小さな誤り確率 λ で，''R'' でなく ''L'' をプレーしてしまう．

{| class="wikitable" style="float: right; clear: right;"
 ! 1＼2
 ! ''L''
 ! ''R''
 ! 確率
 |-
 ! ''gl''
 | (2, 5)
 | (2, 5)
 | (1 − ε) δ
 |-
 ! ''gr''
 | (2, 5)
 | (2, 5)
 | (1 − ε)(1 − δ)
 |-
 ! ''ul''
 | (4, 1)
 | (0, 0)
 | εδ
 |-
 ! ''ur''
 | (0, 0)
 | (1, 4)
 | ε (1 − δ)
 |-
 ! 確率
 | λ
 | 1 − λ
 |}

このように定められた確率のもとで，前記の正規形は右のようになる (周辺に確率を付記した第 2 の表)．

いまや，小さな λ に対して，プレーヤー 1 には戦略 ''gr'' および ''gl'' が摂動完全戦略であることが簡単に見てとれる．したがってプレーヤー 1 は，プレーヤー 2 がどのように意思決定したとしても等しい，2 の安全な利得を得る．''ul'' を選ぶことによって得られる唯一のよい利得は 4 だが，確率にもとづいて，期待値で得られる利得は，
: <math>\mathrm E [u (ul)] = (1 - \lambda) \cdot 0 + \lambda \cdot 4</math>
となる．そして λ < 0.5 のときこの期待値は ''gr'' および ''gl'' が与えるものよりも悪い．

プレーヤー 2 にとっても戦略 ''R'' は摂動完全である．なぜならば，プレーヤー 2 が ''R'' を選ぶよりも ''L'' を選ぶほうが利得が大きくなるような唯一の戦略の組みあわせは (''ul'', ''R'') に比べたときの (''ul'', ''L'') だけであって，ところが ''ul'' が実現するのは，プレーヤー 1 の両方のエージェントが誤りを犯した場合であり，その ''ul'' の確率は最小の εδ だからである．

したがって 2 つの均衡 (''gr'', ''R''), (''gl'', ''R'') は摂動完全均衡である．いま見たように戦略 ''ul'' は摂動完全戦略ではなかったので，(ナッシュ) 均衡 (''ul'', ''L'') は摂動完全均衡ではない<ref>{{cite book | author= Alexander Mehlmann |title= Strategische Spiele für Einsteiger | publisher= Friedr. Vieweg & Sohn Verlag | place= Wiesbaden | year= 2007 }} S.88 - 92</ref><ref>{{cite book | author= Ken Binmore |title= Fun and Games | publisher= Heath | place= Lexington | year= 1992 | edition= 1 }} S.454 - 462 </ref>．

== 関連項目 ==
* [[ラインハルト・ゼルテン]]
* [[ゲーム理論]]
* [[ナッシュ均衡]]
* [[部分ゲーム完全均衡]]
* [[展開型ゲーム|展開形ゲーム]]
* [[標準型ゲーム|標準形ゲーム]]

== 参考文献 ==
* {{cite journal | author= Reinhard Selten |title= A reexamination of the perfectness concept for equilibrium points in extensive games |journal= International Journal of Game Theorie | publisher= Physica-Verlag | place= Vienna | year= 1975 | pages= 25 - 55 }}
* {{cite journal | author= Harold William Kuhn |title= Extensive Games and the Problem of Informations |journal= Contribution to the Theorie of Games, Vol. 2 | publisher= [[Princeton University Press|Princeton Univ. Press]] | place= Princeton | year= 1953 | pages= 193 - 216 }}
* {{cite book | author= Elon Kohlberg, Jean-Francois Mertens |title= On the Strategic Stability of Equilibria | publisher= Econometrica | pages= 1003 - 1037 | year= 1986  }}
* {{cite book | author= Robert Gibbons |title= A Primer in Game Theory | publisher= Financial Times | place= Harlow | year= 1992  }}
* {{cite book | author= Thomas Riechmann |title= Spieltheorie | publisher= Vahlen | place= München | year= 2010 | edition= 3 }}
* {{cite book | author= Christian Rieck |title= Spieltheorie | publisher= Rieck | place= Eschborn | year= 2008 | edition= 8 }}
* {{cite book | author= Alexander Mehlmann |title= Strategische Spiele für Einsteiger | publisher= Friedr. Vieweg & Sohn Verlag | place= Wiesbaden | year= 2007 }}
* {{cite book | author= Ken Binmore |title= Fun and Games | publisher= Heath | place= Lexington | year= 1992 | edition= 1 }}
* {{cite book | author= Jürgen Eichberger |title= Game Theorie for Economists | publisher= Emerald | place= Bingley | year= 2007 | edition= 1 }}

== 外部リンク ==
* [http://wikiludia.mathematik.uni-muenchen.de/wiki/index.php?title=Hauptseite LMU ミュンヘンのプロジェクトであるゲーム理論百科事典]

== 脚注 ==
<references />

{{ゲーム理論}}
{{デフォルトソート:せつとうかんせんきんこう}}
[[Category:ゲーム理論]]
[[Category:数学に関する記事]]