リスク支配のソースを表示

'''リスク支配''' 及び '''利得支配''' らは [[ゲーム理論]]における[[ナッシュ均衡]]の2つの関連した精緻化であり、[[ジョン・ハーサニ]]と[[ラインハルト・ゼルテン]]により定義された。'''利得支配的'''なナッシュ均衡とは同じゲームのナッシュ均衡に対して[[パレート効率性]]を満たすものである{{ref|1|1}}。プレイヤーが均衡選択の場面に直面した際に全てのプレイヤーは、各プレイヤーに他のナッシュ均衡と同等かそれ以上の利得を与える利得支配的なナッシュ均衡を選択することに同意すると予想される。他方で、'''リスク支配的'''なナッシュ均衡とは他プレイヤーの戦略変更に関して最大の安全性を保証するものである。この均衡はプレイヤーが他のプレイヤーの行動に関して伴う不確実性が増すほど、高い確率で選択されうる。

下の[[利得行列]] は二つの 純粋戦略[[ナッシュ均衡]]を持つ単純な2×2ゲームを表している。戦略のペア (Hunt,&nbsp;Hunt)が利得支配的な均衡である。なぜなら両プレイヤーにとって、他の純粋戦略[[ナッシュ均衡]]となる戦略のペア(Gather, Gather)より高い利得を得られるからである。一方, (Gather,&nbsp;Gather)は(Hunt,&nbsp;Hunt)をリスク支配する。なぜなら、他プレイヤーの行動に関して不確実性が存在する場合、Gather戦略がより高い利得をもたらすからである。このゲームは[[スタグハントゲーム]]と呼ばれ、[[ゲーム理論]]における[[ジレンマ]]の一つとして有名である。このゲームの肝は全プレイヤーが協調的な戦略(Hunt戦略)をとった場合は全員に高い利得をもたらすが、他のプレイヤーが協調するか疑念がある場合、Gather戦略が利得確保の点からみて有効である(そしてこの戦略は他者の戦略に左右されない)ことにある。加えて、単独でGather戦略を実行することは、複数人によるGather戦略より選好される。[[囚人のジレンマ]]と同様に、これは信頼できるコミットメントを欠いた共同行動が失敗に終わる理由の一つを示唆している。

<center>
{| class="wikitable" style="margin: auto;"
|P1＼P2  
|Hunt
|Gather
|-
|Hunt    
| 5,5 
| 0,4 
|-
|Gather  
| 4,0 
| 2,2 
|}
</center>

== 厳密な定義 ==
下の[[利得行列]]で表されたゲームが[[協調ゲーム]]であるとき、(行プレイヤーの利得に関して) <math> A > B, D > C</math>、(列プレイヤーの利得に関して)<math>a > b, d > c</math>の二つの不等式条件が成り立つ。戦略のペア {{Math|(H,H)}} と {{Math|(G,G)}} の二つのみが純粋戦略[[ナッシュ均衡]]であることが分かる. 加えて一つの [[混合戦略]][[ナッシュ均衡]]が存在し、それは行プレイヤーが<math>p = (d-c)/(a-b-c+d)</math>の確率で戦略 {{Math|H}}、{{Math|1&minus;''p''}} の確率で戦略 {{Math|G}}、列プレイヤーが<math>q = (D-C)/(A-B-C+D</math>)の確率で戦略 {{Math|H}}、{{Math|1&minus;''q''}} の確率で戦略 {{Math|G}} をプレイすることである。

戦略の組み合わせ {{Math|(H,H)}} は<math> A \geq D,a \geq d</math>かつ、<math>A>D</math>または<math>a>d</math>が成り立っているとき {{Math|(G,G)}} を'''利得支配'''する。戦略の組み合わせ {{Math|(G,G)}} は、ある戦略の組み合わせから逸脱したときの各プレイヤーの損失の積が、<math>(G,G)</math>の場合のときが最も高いなら {{Math|(H,H)}} を'''リスク支配''' する{{Harv|Harsanyi|Selten|1988|loc=Lemma 5.4.4}}。言い換えると, 不等式条件<math>(D-C)(d-c)\geq(B-A)(b-a)</math>が成り立つことである. この不等式条件が強い場合(不等号記号が {{Math|>}})、{{Math|(G,G)}} は {{Math|(H,H)}} を強くリスク支配するという{{ref|2|2}}。

<math>A=a, B=b</math>等となっている[[対称ゲーム]]の場合、不等式条件は以下のようなシンプルな解釈を与えてくれる。プレイヤーは他のプレイヤーがどの戦略を選んで確率を付与するか不確かであると仮定する。すると、各プレイヤーが戦略 {{Math|H}} と {{Math|G}} にそれぞれ確率 1/2 を与えるとすると、戦略 {{Math|G}} をプレイすることによる期待利得が戦略 {{Math|H}} のそれを上回るとき(<math>1/2 B+1/2D\geq1/2A+1/2C</math>または単純に <math>B+D \geq A+C</math>)、{{Math|(G,G)}} は {{Math|(H,H)}}をリスク支配する。

リスク支配的な均衡を導く他の方法は、全ての均衡の危険因子を計算してそれが最小となる均衡を見つけることである。 前述の2×2ゲームの危険因子を計算してみよう。プレイヤーが戦略 {{Math|H}} をプレイするときの期待利得は <math>E[\pi_H]=p A + (1-p) C</math>である（{{mvar|p}} は他プレイヤーが戦略 {{Math|H}} をとる確率)。 戦略 {{Math|G}} の場合の<math>E[\pi_G]=p B + (1-p) D</math>と比較して、 二つの期待利得を等号で結びつける {{Mvar|p}} の値が均衡 {{Math|(H,H)}} の危険因子である。当然、<math>1-p</math>は<math>(G,G)</math>の危険因子である。{{Mvar|p}} を他のプレイヤーが戦略 {{Math|G}} をとる確率とすることで、戦略 <math>(G,G)</math>をプレイすることによる危険因子を同様に計算できる。 <math>p</math>は、自分がある相手の戦略を真似することで得る利得が、他の戦略をとったときより高くしたい際に、その戦略をとると最低限保証されなくてはならない相手がその戦略をとる確率である。

<center>
{| class="wikitable" style="margin: auto;" 
|行＼列
|  H  
|G
|-
|H     
| A,a 
| C,b
|-
|G     
| B,c 
| D,d        
|}
</center>

== 均衡選択 ==
数々の[[進化ゲーム]]理論的アプローチはプレイヤーの数が多いとき、プレイヤーらは利得支配的な均衡をプレイすることに失敗し、被利得支配、被リスク支配的な均衡に陥ってしまうことを示唆している。ある二つの[[進化ゲーム]]モデルでは、リスク支配的な均衡がより起こりやすいとされた。そのうち[[レプリケータダイナミクス]]によるモデルは、個体群は利得支配的な均衡よりリスク支配的な均衡を選ぶことを予測している。もう一方の、 [[戦略修正ダイナミクス]] と [[突然変異]]を組み込んだ[[最適反応動学]]によるモデルはリスク支配的な均衡が唯一の[[確率的安定均衡]] であることを予測している。両モデルでは二人ゲームを要素数 {{Mvar|N}} の個体群に複数回プレイさせている。そこではプレイヤーの相手は他の要素数 {{Math|''N''&minus;1}} の個体群の中からランダムに決まる(どのプレイヤーが相手になるかの確率は無差別)。全てのプレイヤーに戦略 {{Math|G}} または{{Math|H}} が与えられてゲームを開始し、相手とその戦略でもって競争する。[[レプリケータダイナミクス]]では、個体群によるゲームは、集団の一部は過去にとった戦略の成功如何によって戦略を変更することを仮定し世代間で繰り返し行われる。 最適反応動学では、プレイヤーは次世代における期待利得を高くするために戦略をアップデートする。{{Harvtxt|Kandori|Mailath|Rob|1993}} と {{Harvtxt|Young|1993}} の研究によればプレイヤーが突然変異して戦略を変更することが可能で{{ref|4|4}}、 突然変異する確率が漸近的に<math>0</math>に近づいていくなら、例え利得支配されていてもリスク支配均衡に到達する確率が 1 に近づいていく{{ref|3|3}}。

== 注釈 ==
* {{note|1|1}} ゲームの[[ナッシュ均衡]]が一意であった場合、明らかにそれはリスク支配的かつ利得支配的である。
* {{note|2|2}} この記事に記された定義における「強く」と「弱く」の区別に差異はそれほどないものの、必要があるときのみそれを明示する。
* {{note|3|3}} {{Harvtxt|Harsanyi|Selten|1988}} では利得支配均衡が[[スタグハントゲーム]] において合理的な選択だとされているが、{{Harvtxt|Harsanyi|1995}} はリスク支配性に似た選択基準を提唱しており、この結論を撤回している。

== 参考文献 ==
{{参照方法|date=2017年1月|section=1}}
* Samuel Bowles: ''Microeconomics: Behavior, Institutions, and Evolution'', [[Princeton University Press]], pp.&nbsp;45–46 (2004) ISBN 0-691-09163-3 
* Drew Fudenberg and David K. Levine: ''The Theory of Learning in Games'', MIT Press, p.&nbsp;27 (1999) ISBN 0-262-06194-5
* {{cite journal |journal=Games and Economic Behavior  |issn = 0899-8256 |volume=8 |issue=1 |title=A new theory of equilibrium selection for games with complete information  |first1 = John C. |last1 = Harsanyi |url=//www.sciencedirect.com/science/article/pii/S0899825605800181 |year=1995 |pages = 91–122 |doi=10.1016/S0899-8256(05)80018-1 | ref=harv}}
* {{Cite book|first1=John C. |last1=Harsanyi|authorlink1= ジョン・ハーサニ|first2=Reinhard |last2=Selten |authorlink2=ラインハルト・ゼルテン |title=A General Theory of Equilibrium Selection in Games|publisher=MIT Press |year=1988|ISBN=0-262-08173-3 |ref=harv}}
* {{cite journal |journal=Econometrica |volume=61 |issue=1 |title=Learning, Mutation, and Long Run Equilibria in Games |first1 = Michihiro |last1 = Kandori |first2 = George |last2 = Mailath |first3 = Rafael |last3 = Rob |url=http://EconPapers.repec.org/RePEc:ecm:emetrp:v:61:y:1993:i:1:p:29-56 |year=1993 |pages = 29–56 | ref=harv}}
* Roger B. Myerson: ''Game Theory, Analysis of Conflict'', Harvard University Press, pp.&nbsp;118–119 (1991) ISBN 0-674-34115-5 
* [[Larry Samuelson]]: ''Evolutionary Games and Equilibrium Selection'', MIT Press (1997) ISBN 0-262-19382-5
* {{cite journal |journal=Econometrica |volume=61 |issue=1 |title=The Evolution of Conventions |first1 = H. |last1 = Young |url=http://EconPapers.repec.org/RePEc:ecm:emetrp:v:61:y:1993:i:1:p:57-84 |year=1993 |pages = 57–84 | ref=harv}}
* H. Peyton Young: ''Individual Strategy and Social Structure'', Princeton University Press (1998) ISBN 0-691-08687-7 
* グレーヴァ香子:「非協力ゲーム理論」、知泉書館(2011) ISBN 978-4-86285-107-9

{{ゲーム理論|state=uncollapsed}}

{{デフォルトソート:りすくしはい}}
[[Category:進化ゲーム理論]]
[[Category:数学に関する記事]]