進化的安定戦略

提供: testwiki
ナビゲーションに移動 検索に移動

テンプレート:Pathnavbox 進化的安定戦略(しんかてきあんていせんりゃく、テンプレート:Lang-en-shortESS)は、進化生物学およびゲーム理論の重要な概念で、ジョン・メイナード=スミスジョージ・プライスによって1973年に提唱された[1]

これは、生物の母集団の取る、「侵略されない戦略」の概念を基礎としている。仮に突然変異対立遺伝子が発生し、別の戦略を取って他の生物に働きかけようとしても、母集団を侵略することはできず、逆に自然淘汰で排除されてしまうような戦略である。メイナード=スミスらはこの概念によってゲーム理論の有効性を広く示し、行動生態学経済学心理学などに影響を与えた。

概要

具体例をもとに進化的安定性を説明する[2]。動物が交尾相手や餌といった資源を同じ種の個体と争う場合、互いに殺し合うような闘争を避け、威嚇などの儀式的な闘争をする事で決着をつける事がある。 こうした儀式的闘争が発達した原因として、進化的安定性の概念が登場する以前は、「闘争の際に殺し合いを行なう種は絶滅してしまうので、儀式的闘争をする種だけが生き残った」といった群淘汰的な理由づけ[3]がなされがちであった。

しかし自然選択の対象が個々の個体である事を考えると、群淘汰的な理由づけでは儀式的闘争が数多くの種で発達した事をうまく説明できない。また、実際の動物の闘争を観察すると、戦いがエスカレートして傷つけ合ったり殺し合ったりする事も珍しくない[2]事も前述した理由づけとは合致しない。

そこで、儀式的闘争のような現象を群淘汰に頼らず、生物進化の基本的な原則である「自然選択によって繁殖成功率が高い適応戦略が種に広がっていく」という事によって説明する為の枠組みが、本稿の主題である進化的安定性である。

話を簡単にするため、動物の戦略が「タカ戦略」と「ハト戦略」の2つのみからなる場合を考える。タカ戦略とは、闘争がエスカレートした場合に戦う戦略であり、ハト戦略は闘争がエスカレートした場合には逃げる戦略である。

もし同じ動物種に属する全ての個体が常にハト戦略を取るのであれば、儀式的なものであれ実際的なものであれ、闘争は生じないであろう。しかしこのような種に突然変異などによって生まれた、タカ戦略を取る個体が少しでも侵略してくれば、周囲にいるハト戦略の個体は全て逃げ出すわけだから、タカ戦略を持つ個体が圧倒的に有利となり、子孫を残す事で種にタカ戦略が広がる事となる。したがってハト戦略を取る個体だけからなる種は安定しない。

逆に全ての個体が常にタカ戦略を取るとすれば、闘争は常にエスカレートする。ここにハト戦略の個体が侵入してくると、他の個体が闘争により著しく疲弊している中、闘争から逃げているハト戦略の個体だけが有利となり、ハト戦略が種の中に広まっていく。したがってタカ戦略を取る個体だけからなる種もやはり安定しない。

こうして、ハト戦略の個体とタカ戦略の個体が混じり合った状態で種は安定する事になる。この状態では、闘争相手がハト戦略を取るかタカ戦略を取るかを見極める事が重要となる為、儀式的闘争が発達する事になる。

進化的安定性は、上で述べたような複数の戦略が入り混じった状態での安定性概念である。

混合戦略

前節で説明した例をはじめとして、生物による多くの駆け引きは、自身の利得を最大化しようとする個体の同士による一種のゲーム(進化ゲーム)とみなす事ができる為、生物の駆け引きをゲーム理論により記述する事ができる。

進化的安定性の概念もゲーム理論の枠組みで記述でき、その定式化にはゲーム理論における混合戦略の概念が有用となる。

前節で説明した例を使って説明すると、闘争が必要になった時、各個体が取りうる選択肢として、「タカ戦略」と「ハト戦略」という二種類の戦略(純粋戦略)があった。しかし各個体はこれらの純粋戦略のうちひとつを常に取り続けるわけではなく、「30%の確率でタカ戦略を取り、70%の確率でハト戦略を取る」といった戦略をも取りうる。

混合戦略とは、このように個々の純粋戦略の上に確率を付与した戦略を指す。進化的安定性の概念は、この混合戦略の概念に対して定式化される。

進化的安定性の直観的な定式化

進化的安定性とは、何らかの混合戦略が集団の中で支配的になるための条件である。すなわち、混合戦略 σ が進化的に安定であるとは、直観的には、集団の中に戦略σがすでに広まっている状況下において、 別の混合戦略τ を取る個体が少数侵入してきたとしても、それが排除される事をいう。

より詳しく言うと、たとえσ に近い別の混合戦略 τ を取る個体群が集団に少数侵入してきたとしても、戦略σ を取る個体と戦略τを取る個体が2者間で戦った際、前者の個体の方がより高い利得が期待できるため、戦略τを取る個体は自然選択により、いつしか集団から消えてしまう、という事である。

ゲーム理論からの準備

進化的安定性はゲーム理論の概念に基づいて定式化することができる。そこで本節では、必要なゲーム理論の概念を導入し、次節で進化的安定性を定式化する。

利得関数

定義

進化的安定性を定義するには、まず個々の個体の利得をゲーム理論的に定義する必要がある。ゲーム理論において利得はほかの個体とゲームを行ったときに得られる実数値として定義され、得られる利得は自分が取った戦略と対戦相手がとった戦略の結果として決まる。

すなわち、純粋戦略i を取る個体P が、純粋戦略 j を取る別の個体Qとゲームを行ったとき、個体P利得と呼ばれる実数値

E(i,j)

を獲得する。そしてijE(i,j)を対応させる関数Eを個体Pに関する利得関数と呼ぶ。


利得関数はゲームが始まる前の段階で、外界の状況等により事前に定まっており、個々の個体が変えることはできない。個々の個体にできるのは、与えられた利得関数から得られる利得を最大化するよう自身の戦略を選ぶことだけである。

対称性

進化的安定性を定義する際には、全ての個体に対して同一の利得関数が適用される事が前提となる。したがって純粋戦略i を取る個体P が、純粋戦略 j を取る別の個体Qと戦った時、個体Qが得る利得を

E(i,j)

とすると、

E(i,j)=E(j,i)

が任意のijに対して成立する事が要請される。利得関数がこのような性質を満たすゲームを対称なゲームという。

混合戦略の利得

混合戦略を取る個体の利得は、純粋戦略に対する利得の期待値として定義される。すなわち、各個体が取りうる純粋戦略にテンプレート:Mathと番号をつけ、純粋戦略テンプレート:Mathを取る確率がテンプレート:Mvarである混合戦略を(pi)i=1,,nと書く事にすると、個体PQがそれぞれ混合戦略σ=(pi)i=1,,nξ=(qi)i=1,,nを取る際のPの利得は、

E(σ,τ)=i,jpiqjE(i,j)

により定義される。

進化ゲームの定式化

進化的安定性を定義するためのゲーム(進化ゲーム)は以下のようなものである。なお、このゲームはゲーム理論の言葉で言えば「対象な2人戦略型ゲーム」に相当する。

進化的安定性を定義するための進化ゲームでは、対戦する2個体ABが選択肢として取りうる純粋戦略12、…、および利得関数テンプレート:Mvarが「ゲームのルール」として事前に定まっている。そしてABは以下の手順でゲームを行なう:

  1. ABはそれぞれ、与えられた選択肢の中から1つの純粋戦略ijを秘密裏に選ぶ
  2. ABijを同時に公表する
  3. ABはそれぞれ利得E(i,j)E(j,i)を得る。

ABの目的は、自身の利得を最大化する事である。

前節でも述べたように、進化的安定性の文脈では全ての個体に対して同一の利得関数が適用される事が前提とされるため、上述したゲームにおいてABが得られる利得はそれぞれE(i,j)E(j,i)と対称な形になっている。

上述した進化ゲームは、ゲームに参加する2個体AB取りうる純粋戦略をそれぞれ行、列としてABの利得を行列の形にまとめた利得表により特徴づけられる。

具体例

下に上げたのは、前述したタカ戦略、ハト戦略からなる進化ゲーム(タカハトゲーム)の利得表である[4]

タカ ハト
タカ (VC2,VC2) (V,0)
ハト (0,V) (V2,V2)

ここでテンプレート:Mvarは2個体が争っている資源(例えば餌)を得た時に得られる利得を表し、テンプレート:Mvarは闘争によって怪我を追う事による損失を表す。

また利得表で縦軸は個体Aの取る戦略、横軸は個体Bの戦略であり、表内の (○, △)は、A、Bの利得がそれぞれ○、△である事を意味する。例えば表の左下のマスにかかれているテンプレート:Mathは個体Aがハト戦略、個体Bがタカ戦略を取った時、ABの利得がそれぞれテンプレート:Mvarテンプレート:Mvarである事を意味する。表の左上と右下で値が2で割られているのは、2個体で資源を分け合った為である。


混合戦略の線形結合

最後に、進化的安定性を定義する際に記法を簡単にするため、混合戦略の「線形結合」を定義する。

以下、話を簡単にするため、各個体が取れる純粋戦略の種類が有限個である事を仮定するが、無限個の場合にも自然に定義を拡張できる。

まず、記号を定義する。各個体が取りうる純粋戦略にテンプレート:Mathと番号をつける。そして純粋戦略テンプレート:Mathを取る確率がテンプレート:Mvarである混合戦略を(pi)i=1,,nと書く事にする。

2つの混合戦略のσ=(pi)i=1,,nξ=(qi)i=1,,n、および実数テンプレート:Mvarテンプレート:Mvarが与えられた時、テンプレート:Mvarテンプレート:Mvarテンプレート:Mvarテンプレート:Mvarによる線形結合

aσ+bξ=(api+bqi)i=1,,n

により定義する。a+b=1であれば、混合戦略の線形結合aσ+bξもまた、混合戦略である。

テンプレート:Mvarを利得関数とするとき、任意の混合戦略テンプレート:Mvarテンプレート:Mvarテンプレート:Mvarに対し、次が成立する事が簡単な計算により分かる:

E(τ,aσ+bξ)=aE(τ,σ)+bE(τ,ξ)   …テンプレート:EquationRef

進化的安定性の厳密な定義

有限個の純粋戦略を持つ戦略型ゲームの事を(利得表が有限サイズの行列の形に書けるので)行列ゲームテンプレート:Refnestといい、これはもっとも典型的な進化ゲームの一つである。本節では対称な行列ゲームに対する進化的安定性を3つの異なる視点から定義づける。これら3つの定義は対称な行列ゲームにおいては同値であるが、より一般的な進化ゲームにおいては必ずしも同値ではない。

定義

対称な行列ゲームにおける進化的安定性は以下のように定義される[5][6]テンプレート:Math theoremテンプレート:EquationNoteテンプレート:Mvar侵入障壁という。テンプレート:EquationNoteでは侵入障壁テンプレート:Mvarが混合戦略テンプレート:Mvarに依存する事を許容するバージョンの定義を採用したが、テンプレート:Mvarテンプレート:Mvarに依存しないバージョンの定義も存在し、これを一様な侵入障壁をもつ進化的安定性ESS with uniform invasion barrier)と呼ぶ[6]。一般には一様なもののほうがそうでないものより強い定義であり、純粋戦略が無限個あるゲームの場合には進化的安定であるにもかかわらず一様な侵入障壁をもつ進化的安定ではない混合戦略が存在する事が知られている[7]。しかしテンプレート:EquationNoteで考えているゲーム(=有限個の純粋戦略を持つ対象な戦略型ゲーム)の範囲では、両者の定義は同値である[7][8]

定義の解釈

混合戦略σ*を取る個体の集団に、混合戦略σを取る個体群が侵入し、集団全体の中で後者の割合がテンプレート:Mvarになったとする。このとき、対戦相手がランダムに選ばれるとすれば、混合戦略σ*を取る個体の利得の期待値は

(1ε)E(σ*,σ*)+εE(σ*,σ)=E(σ*,(1ε)σ*+εσ)

となり、テンプレート:EquationNoteで登場する不等式の左辺と一致する。同様の理由により混合戦略σを取る個体の利得の期待値は

E(σ,(1ε)σ*+εσ)

となり、テンプレート:EquationNoteで登場する不等式の右辺と一致する。

したがってテンプレート:EquationNoteは混合戦略σを取る個体群がε0以下の割合テンプレート:Mvarだけ侵入したとしても、混合戦略σ*を取る個体の利得の期待値の方が混合戦略σを取る個体の利得の期待値よりも真に大きくなる事を示している[9]

局所優位性(local superiority)

2つの混合戦略σ*=(pi)i=1,,nσ=(qi)i=1,,n距離

d(σ*,σ):=i=1n|piqi|2   …テンプレート:EquationRef

により定義するとき[10]、進化的安定性を以下のように異なる角度から特徴づける事ができる[8][10][11]テンプレート:Math theoremなお、上では距離をテンプレート:EquationNote式に従って定義したが、テンプレート:EquationNoteに書いたESSの別定義で本質的なのは距離そのものではなく、距離から定まる位相構造なので[12]テンプレート:EquationNote式の代わりに以下の1距離

d(σ*,σ):=i=1n|piqi|   

を用いて定義してもテンプレート:EquationNoteのものと同値になる。

テンプレート:EquationNoteに書いたESSの別定義はより広範な進化ゲームに対して進化的安定性の概念を一般化する場合に有益であり[13]、一般化のさせかたにより、neighborhood invader strategy、neighborhood superiorなどとも呼ばれる[13]

簡便な特徴づけ

テンプレート:EquationNoteは進化的安定性の直観的な意味を自然に定式化したものになっているものの、この定義に基づいて混合戦略の進化的安定性を直接チェックするのは容易ではない。そこで進化的安定性をより簡単にチェックする事を可能にする、別の特徴付けを紹介する[1]テンプレート:Math theorem


テンプレート:Math proof

与えられた混合戦略テンプレート:Mvarに対し、E(ξ,τ)を最大にする混合戦略テンプレート:Mvarテンプレート:Mvar最適反応(best reply)という[14]

均衡条件は、σ*σ*自身の最適反応である事を意味しており、E(ξ,σ*)の最大値はM=E(σ*,σ*)である[14]。一方、安定条件は、M=E(σ,σ*)を満たすσσ*、すなわちσ*に対する最適反応のうちσ*以外の混合戦略σE(σ*,σ)>E(σ,σ)を満たしている事を意味している[14]

ナッシュ均衡との関係

ゲーム理論における重要な均衡概念としてナッシュ均衡があり、進化的安定性は(σ*,σ*)のナッシュ均衡性と関係がある。本項で考えているゲーム(2人対称戦略型ゲーム)の場合、混合戦略の組(σ*,σ*)ナッシュ均衡であるとは任意の混合戦略テンプレート:Mvarに対し、

E(σ*,σ*)E(σ,σ*)  …テンプレート:EquationRef

が成立する事を言う。特に任意の混合戦略テンプレート:Mvarに対してテンプレート:EquationNote式の不等号がイコールなしで成り立つ場合、(σ*,σ*)狭義ナッシュ均衡であるという。

テンプレート:EquationNoteから明らかに以下の事実が成りたつ[15]テンプレート:Math theorem しかしテンプレート:EquationNoteの逆向きの包含関係は一般には成立しない[15]

具体例

前述したタカハトゲーム対してテンプレート:EquationNoteを適用する事で次が成立する事が分かる[16]


進化的安定性概念の一般化

モチベーション

これまで本稿では、行列ゲームに対する進化的安定性を議論してきたが、行列ゲームは下記のような条件を満たす場合にしか現実世界の生物の闘争をモデル化できない:

  1. ゲームは一度しか行われない
  2. 各個体がとれる純粋戦略の個数は有限である
  3. 各個体がどの純粋戦略を取るのかはゲーム開始時点にランダムに選ぶ事ができる
  4. ゲームは常に2個体で行われる
  5. 全ての個体に対して同一の利得関数が適用される事が前提としている

しかし実際の生物学における応用では、以上の条件を満たさない事も多い:

  1. 多くの状況では各個体はその生涯において何度も他の個体と闘争を繰り返すので、ゲームを繰り返し行う形でモデル化した方が自然な場合が多い
  2. 「植物が種を飛ばす飛距離」や「動物が行動を起こすまでの時間」のように純粋戦略として連続量を取る事ができるケースでは純粋戦略の個数は無限にある
  3. 哺乳類の配偶戦略のように「オスかメスか?」という生まれた段階で決定する戦略は、ゲーム開始時点にランダムに選ぶ事はできない
  4. 草むらで種をばらまいて近くにいる他の全ての個体と種のばらまく位置を争うケースのように、複数個体と争うゲームも多い
  5. 「オスとメス」、「テリトリーを守る個体とそこに侵入する個体」のように非対称な闘争では、闘争する個体がどちらの立場にいるのかで利得関数が異なるはずである

本章の目標は上で述べたような、行列ゲームの範疇に収まらないより一般的なゲームに対して進化的安定性を定義する事である。

一般化の手法

本節では上述した1,...,5の制約を外すための手法を順に述べていく。

繰り返しゲーム

まず1に関しては、ゲーム理論の言葉で言えば繰り返しゲームを考える必要がある、という事である。一回のゲームの利得と繰り返し行ったゲームの利得の平均値とを区別する為、一回のゲームの利得はこれまで通りE(,)で表し、繰り返し行ったゲームの利得の平均値を(,)と表す事に事にする。

ゲームを行うたびに闘争相手が毎回異なると仮定できる場合には、繰り返しゲームの平均利得(,)E(,)と一致する(詳細後述)。一方、同一の闘争相手と何度もゲームを繰り返す場合はより複雑で、後退帰納法(有限繰り返しゲームの場合)やフォーク定理(無限繰り返しゲームの場合)など、ゲーム理論の手法を用いて(,)を求める必要がある。

戦略空間

2および3に関しては、戦略空間(strategy space)という概念を導入する事で一般化を図る[17][18]。戦略空間とは、そのゲームにおいて各個体が取りうる戦略全体の集合の事である。例えば行列ゲームの場合は混合戦略全体の集合が戦略空間である。すなわち、

Δn={(pi)i=1,,n|0p1,,pn1,i=1npi=1}    ...(テンプレート:EquationRef)

が戦略空間である。ここでテンプレート:Mvarは取りうる純粋戦略の個数である。

また「個体の体長」のように連続量の純粋戦略が取れる(が闘争の際ランダムに体長を変える事はできないので混合戦略は取れない)ゲームの場合、戦略空間は正の実数全体の集合

𝐑+={x>0x𝐑}

である。一方「動物が行動を起こすまでの時間」のように純粋戦略は連続量であり、混合戦略も取りうるゲームの場合には、戦略空間は

{テンプレート:Math上の確率分布}

である[19]。なお進化的安定性の議論では、戦略間の「近さ」の概念が定義できる事が望ましいので、戦略空間が位相空間である事を求める事も多い[18]

個体群

4に関しては、個体vs.個体だけでなく個体vs.個体群(population)の闘争を考える事で一般化を図る[20]。個体群に属する個体数が有限である場合には数学的解析が難しくなるので、以下本説では個体数が無限であるものと仮定する[21]。より厳密に言うと、戦略空間テンプレート:Mvarに属する戦略テンプレート:Mvarを取る個体の割合をテンプレート:Math区間に属する実数として定義できるものと仮定する。現実には無限の個体を含む個体群は存在しないが、個体群に属する個体が十分大きい場合には、近似的にこのような仮定を置いて議論を進める事ができる。

個体群の各々の個体は戦略空間テンプレート:Mvarに属するいずれかの戦略を取る。個体群テンプレート:Mvarにおいて、「戦略テンプレート:Mathを(確率1で)取る個体の割合がそれぞれテンプレート:Mathである」という状態を

ε1δσ1++ε1δσm

もしくは

i=1mεiδσi

と表記し[22]、これをテンプレート:Mvar個体群戦略(population strategy[23])と呼ぶ。個体群戦略と区別するため、個々の個体の戦略の事を強調して個体戦略(player strategy[23])と呼ぶ。

なお上の式における記号「テンプレート:Mvar」は、混合戦略の和「ε1σ1++ε1σm」と区別する為につけられた単なる記号であると解釈して差し支えない。この場合、上記の式は数学的には形式和である。しかしこのテンプレート:Mvarテンプレート:Mvar上で定義されたディラックのデルタ関数であると解釈する事で、上式をテンプレート:Mvar上の分布を表す式とみなす事もできる。

また上では個体群が有限個の戦略テンプレート:Mathのいずれかしか取らない場合を考えたが、テンプレート:Mvar性質のよい空間であれば無限個の戦略を取る場合も考える事ができる。しかし進化的安定性を定義する上では有限個の戦略を取る場合のみを考察すれば十分であるので、本稿では以下、無限個の戦略を取る場合は考えない。

本稿では個体群の性質として主として考えるのは個体群戦略のみなので、紛れがなければ個体群テンプレート:Mvarとその個体群戦略とで記号を混用し、

Π=ε1δσ1++ε1δσm

という表記も用いるものとする。

対称化

5で述べたように実際の生物では2つの個体の立場が非対称なゲームも起こりうるが、進化ゲーム理論では2つの個体が対称な場合のみに対して進化的安定性を定義し[24]、非対称なゲームには対称化を施す事により対称なゲームに対する進化的安定性の概念を利用する。例えば「オス」と「メス」という2つの立場がある状況では、個体が受精した際「オス」か「メス」かをランダムに選べる事を考慮する事により、全ての個体が「オス」になる可能性も「メス」になる可能性もある対称なゲームとして定式化する。

そこで本章では以下、対称なゲームに対する進化的安定性のみを議論するものとし、非対称なゲームに対する進化的安定性は後の章で議論するものとする。

行列ゲームの再定式化

以上までで述べた一般的なフレームワークにおける進化的安定性の定義を述べる前に、行列ゲームを上述のフレームワークにおいて再定式化する。このためにテンプレート:Mvar通りの純粋戦略テンプレート:Mathが取れる行列ゲームを考え、その利得関数をテンプレート:Mvarとする。さらにテンプレート:Mvarを個体群とし、テンプレート:Mvarを個体群テンプレート:Mvarの中にいる一匹の個体とし、テンプレート:Mvarが取る混合戦略をσ=(pi)i=1,,nとする。

前章で述べた行列ゲームでは、テンプレート:Mvarは個体群テンプレート:Mvarの中のいずれか一匹の個体と一度だけゲームを行う事を前提としていた。しかし本章で述べる一般的フレームワークにおいては、テンプレート:Mvarの中の複数の個体と闘争する事を前提としている。より正確に言うと、定数テンプレート:Mvarを固定し、以下のようなゲームをテンプレート:Mvar回繰り返す:

  1. テンプレート:Mvarの中から一様ランダムに一匹の個体テンプレート:Mvarを選ぶ(テンプレート:Mvarテンプレート:Mvar回行う各ゲームで毎回独立に選ばれる)。
  2. テンプレート:Mvarテンプレート:Mvarが利得関数テンプレート:Mvarを持つ行列ゲームを行う。

そしてこのようなゲームにおけるテンプレート:Mvarの平均利得を(σ,Π)と表記する(ここで我々は前節で述べたように記号を混用して個体群テンプレート:Mvarの個体群戦略にもテンプレート:Mvarという記号を用いている)。

テンプレート:Mvarの個体群戦略が混合戦略テンプレート:Mvarにより

Π=εδσ+(1ε)δτ

と書けるとき、テンプレート:Mvarの対戦相手テンプレート:Mvarの戦略は確率テンプレート:Mvarテンプレート:Mvarであり、確率テンプレート:Mathテンプレート:Mvarである。行列ゲームはテンプレート:Mvar回行われるが、我々は個体群テンプレート:Mvarには無限に多い個体が含まれていると仮定していたので(前述)、テンプレート:Mvarが同一の個体と複数回ゲームを行う事はありえない。よってテンプレート:Mvar回の行列ゲームの平均利得(σ,Π)は明らかに

(σ,εδσ+(1ε)δτ)=1ki=1k(εE(σ,σ)+(1ε)E(σ,τ))=E(σ,εσ+(1ε)τ)

を満たす[25]。すなわち行列ゲームの場合は複数回のゲームの平均利得(,)と個体群戦略Π=εδσ+(1ε)δτで考えようが、一回の行列ゲームの利得E(,)と1個体の混合戦略εσ+(1ε)τで考えようが実質的な差はない。

しかし行列ゲーム以外のゲームではこのような単純な関係が成立するとは限らず、そもそも「2個体間の一回のゲームの利得」E(,)が定義できない場合もある(例えば、2個体間の闘争ではなくテンプレート:Mvarの全ての個体が闘争する場合)ので、本章で述べる一般的なフレームワークにおいて改めて進化的安定性の概念を定式化する必要がある。

進化的安定性の定義

以上の準備の元、進化的安定性の概念を一般化する。集合テンプレート:Mvarを一つ固定し、これを戦略空間と呼び、テンプレート:Mvarの元を戦略ないし個体戦略と呼ぶ。そして任意の戦略テンプレート:Mathに対し、形式和

i=1mεiδσi  (0ε1,iεi=1)

個体群戦略と呼ぶ。さらに戦略テンプレート:Mvarと個体群戦略i=1nεiδσiの組に利得と呼ばれる実数を対応させる関数

:(τ,i=1nεnδσn)𝐑

を一つ固定し、この関数を利得関数と呼ぶ。直感的にはの第一変数の個体戦略を取るある個体テンプレート:Mvarが、個体群戦略i=1nεiδσiを取る個体群の中で(一般には複数回)闘争したときのテンプレート:Mvarが得られる利得(ないしその平均値)が(τ;i=1nεnδσn)になるという事である。

以上のフレームワークにおいて、ゲームは戦略空間テンプレート:Mvarと利得関数の組(X,)として定義される。

ゲーム(X,)に関する進化的安定性は以下のように定義される[26]テンプレート:Math theorem上の定義ではテンプレート:Mvarテンプレート:Mvarに依存する事を許容しているが、テンプレート:Mvarに依存しないテンプレート:Mvarが取れる場合には、一様な侵入障壁をもつ進化的安定性ESS with uniform invasion barrier)と呼ぶ[27]


の定義より、任意の戦略σX(σ,)のように個体戦略としての第一変数としてする事も、(,δσ)のように個体群戦略としての第二変数として登場する事も可能である。したがって「オス」と「メス」のように立場の異なる個体が存在したとしても、第一変数を「オス」の戦略、第二変数を「メス」の戦略といったふうに2つの変数を使い分ける事はできない。すなわち前述したように、立場の異なる個体間の非対称なゲームに対する進化的安定性を上記の定義では記述できず、何らかの「対称化」の操作を行う事によって非対称ゲームを記述する必要がある。対称化に関しては後の章でより詳しく説明する。

の性質

すでに述べたように行列ゲームでは

(σ,εδσ+(1ε)δτ)=E(σ,εσ+(1ε)τ)

という単純な関係があり、しかも行列ゲームの利得関数は行列を用いて簡単に表記できるので、線形性

(iνiσi,jεjδτj)=i,jνiεj(σi,δτj)

が成立した。

しかしこうした性質は行列ゲーム以外のゲームでは必ずしも成立するとは限らない。実際我々は現段階では一般のゲームにおけるには一切仮定をおいていない為、線形性どころか連続性すら成り立つとは限らない。

このため行列ゲームに対して示した性質は一般のゲームに対しては無条件に成り立つとは限らず、線形性など何らかの仮定をおいた上でこうした性質(の類似物)を示す必要がある。

そこで本節では、線形性などに関する性質をいくつか導入し、これらの性質を元に進化的安定性の満たす性質を示す。

個体群戦略に関する線形性と個体戦略に関する線形性

本節ではの線形性の概念を定義する。テンプレート:Math theorem

行列ゲームにおける混合戦略のように、戦略空間上に線形和が定義できる場合には、左線形性も同様に定義できる:テンプレート:Math theorem

これら2つの性質は行列ゲームの場合は明らかに満たされる。

多くのゲームにおいて、戦略空間テンプレート:Mvarは行列ゲームの場合と同様、何らかの混合戦略全体の空間であり、混合戦略σ=(pi)i=1,,nの利得は(σ,Π)=ipi(i,Π)のように純粋戦略の利得の期待値として定義されるので、個体戦略に対する線形性は多くのゲームで成立する[28]

それに対し個体群戦略に対する線形性は満たさないゲームも多く、例えば以下の3つの状況では満たされない事が多い:

  • ゲームが1:1の闘争でないとき[28]
  • (1:1の闘争であったとしても)同じ個体と複数回闘争しなければならないとき[28]
  • 取りうる戦略が連続量であるとき[28]

2013年現在、「線形性が満たされないゲームに関する一般的な理論はまだ十分に発展しているとは言い難い」[28]状況にあり、個別のゲームに応じた議論を行う必要がある。

多型-単型同値性

行列ゲームにおける戦略空間テンプレート:Mvarは混合戦略全体の集合なので、戦略同士の線形和が定義できる。このように戦略空間テンプレート:Mvar上に何らかの和の概念が定義できている場合、以下の概念を定式化できる:テンプレート:Math theorem多型-単型同値性は行列ゲームでは明らかに成立する:

(σ,iεiδσi)=E(σ,iεiσi)=(σ,δiεiσi)


多型-単型同値性の直観的な意味を説明する。テンプレート:EquationNoteの式の左辺ではの第2変数がi=1nεiδσiであるので、個体群の中には戦略σ1を取る個体が割合ε1だけ存在し、...、戦略σnを取る個体が割合εnだけ存在するという状況を左辺は意味している。一方右辺ではの第2変数がδi=1nεiσiであるので、個体群に属する全ての個体が全く同一の戦略i=1nεiσiを取っている状況を右辺は意味している。

多型-単型同値性はσ1,,σnが純粋戦略であるケースを考えると理解しやすい。上で述べた事から、テンプレート:EquationNoteの式の左辺は純粋戦略σ1を取る個体が割合ε1だけ存在し、...、純粋戦略σnを取る個体が割合εnだけ存在するという状況である。すなわち全ての個体は何らかの純粋戦略を取っており、個体毎にどの純粋戦略を取るのかが決まっている状況である。これは例えば、遺伝的多型により、個体が生まれた段階でどの純粋戦略を取るのかが決まる場合がこの状況に相当する。


一方、テンプレート:EquationNoteの式の右辺は、全ての個体が全く同一の混合戦略i=1nεiσiを取っている状況である。これは例えば、「混合戦略i=1nεiσiを取る事」が遺伝的に単型な形で刷り込まれており、ゲーム開始の段階でランダムにσ1,,σnのうちどれかを行う場合がこの状況に相当する。


多型-単型同値性はこの多型のケースと単型のケースがの第一変数の戦略を取る個体テンプレート:Mvarの平均利得という観点から見るとこの「多型」の状況と「単型」の状況に差がない事を意味する。


テンプレート:Mvarの闘争相手がゲームのたびに個体群から毎回ランダムに選ばれるケース(個体群の個体数は無限大なのでこれは闘争相手が毎回異なる事を意味する)における繰り返し行列ゲームの場合には、明らかに多型-単型同値性が成立する。しかしゲームによっては多型-単型同値性が成り立たないものもあり、次章以降でそうしたゲームについて見る。

進化的安定性の簡便な特徴づけ

行列ゲームにおける進化的安定性の概念が均衡条件と安定条件により特徴づけられる事をテンプレート:EquationNoteで見た。この定理は本章で述べた一般的なゲームに関する進化的安定性に対しては常に成立するわけではないが、適切な条件下ではテンプレート:EquationNoteの類似物を示す事が可能である。

前節までと同様、テンプレート:Mvarを戦略空間とし、(,)テンプレート:Mvar上の個体戦略と個体群戦略に「利得」とよばれる実数値を対応させる関数とする。さらに戦略σ*,σXを固定し、インセンティブ関数hσ*,σ

hσ*,σ:[0,1]𝐑,ε(σ*,εδσ*+(1ε)δσ)(σ,εδσ*+(1ε)δσ)

により定義する[29]。ここで[0,1]は0以上1以下の実数全体の集合である。このとき次が成立する[29]テンプレート:Math theorem多くの生物学上の応用では、

εhσ*,σ(0)=0

を満たす(σ*,σ)X2の集合は零集合(≒面積0の集合)であるので、上記偏微分が0になる確率が0である事を多くのケースでは仮定できる(これをgeneric payoff assumptionという[30][注 1]。この仮定の元では進化的安定性は均衡条件と安定条件が両方成立する事とほとんど至る所で同値である。

定理3と定理G5の関係

本節ではテンプレート:EquationNoteテンプレート:EquationNoteの関係を見るため、テンプレート:EquationNoteを行列ゲームに適用してみる。すでに述べたように行列ゲームでは

(σ,εδσ+(1ε)δτ)=E(σ,εσ+(1ε)τ)

であり、E(,)は右線形かつ左線形であるので、インセンティブ関数hσ*,σ

hσ*,σ(ε)=εE(σ*σ,σ*)+(1ε)E(σ*σ,σ)

である。よってテンプレート:Mathにおける偏微分は

εhσ*,σ(0)=E(σ*σ,σ*σ)

である。テンプレート:EquationNoteの安定条件の仮定(σ*,δσ*)=(σ,δσ*)が成り立つ条件下では

E(σ*σ,σ*σ)=E(σ,σ)E(σ*,σ)

であるので、テンプレート:EquationNoteの安定条件はテンプレート:EquationNoteのそれと一致する。すなわちテンプレート:EquationNoteは、E(σ*σ,σ*σ)0を要求する事以外はテンプレート:EquationNoteと一致している。

具体例

個体群ゲーム(Population Game)

本章では個体群ゲームというゲームを定義し、このゲームにおける進化的安定性の性質を述べる。

モチベーション

多くのゲームにおいて、戦略空間テンプレート:Mvarは行列ゲームの場合と同様、有限個の純粋戦略を混合した混合戦略全体の空間であり、混合戦略σ=(pi)i=1,,nの利得は

(σ,Π)=ipi(i,Π)

のように純粋戦略の利得の期待値として定義される。ここでさらに多型-単型同値が成り立てば、任意の個体群戦略Π=jεjδσj

Π=δτ

のようにたった一つの混合戦略τ=iεjσjにより記述できる。ここでfi(τ):=(i,τ)と定義すれば、

(σ,δτ)=ipifi(τ)

が成立する事になる。利得関数が上式のように書けるゲームが個体群ゲームである。

定義

以上をまとめると次のようになる[31][32]。なお以下でテンプレート:Mvarは(テンプレート:EquationNote)式で定義される集合であり、直観的には有限個(テンプレート:Mvar個)の純粋戦略を混合した混合戦略全体の空間を意味する。テンプレート:Math theoremテンプレート:Math theorem

応用例:場を通じる型(playing the field)

行列ゲームでは個体テンプレート:Mvarが個体群テンプレート:Mvarからランダムに選ばれた個体テンプレート:Mvarと1:1の闘争を行うケース(1対1型[33])を想定していた。しかし生物学における実際の状況は、このようなテンプレート:Mvarは1:1の闘争を行うものばかりではなく、テンプレート:Mvarが個体群テンプレート:Mvarに属する全ての他の個体と闘争しなければならないものも存在する。

このようなテンプレート:Mvarの全ての他の個体との闘争を行われる状況を場を通じる型[33]playing the field[34])という。例えば植物が種を飛散させる状況下では、近くにいる他の全ての個体と土地を争わなければならないので、場を通じる型の類型に属する[34]

場を通じる型のセッティングでは、そもそも1:1の闘争は行われないので行列ゲームのような1:1の闘争を前提とした利得関数テンプレート:Mvarは定義できず、テンプレート:Mvarを使わずに直接(σ,Π)を定義する必要がある事になる。

この際利用できるのが、個体群ゲームのフレームワークである[35][36]テンプレート:EquationNoteで述べたように、左線形性や多型-単型同値などの条件が成立しさえすれば、場を通じる型の状況を個体群ゲームとして記述できるので、個体群ゲームは有益な概念である。

性質

以下の2つの性質が成立する[37]テンプレート:Math theoremテンプレート:Math theorem ここでテンプレート:Mvarテンプレート:EquationNote式により定義されるX=Δn上の距離であるが、テンプレート:EquationNoteと同様、テンプレート:Mvarと同一の位相を定める距離であれば他のものでもよい。

非対称なゲーム

これまで全ての個体が対等である状況を考察してきたが、実際の生物学では「オス vs. メス」、「テリトリーの所有者 vs. テリトリーへの侵入者」、「体の大きい個体 vs. 体の小さい個体」のように2つの非対称な立場がある個体同士が闘争する。しかし前章でも述べたように、進化ゲーム理論ではこうした非対称なゲームに関しては何らかの「対称化」を施すことにより、対象なゲームとして進化的安定性を定義する[24]

非対称なゲームの記述

本節では非対称なゲームを定式化し、対称化を方法を述べる。今各個体には2つの立場[33](role)があり、どちらの立場にいるかにより取れる戦略が異なるものとする。立場0、立場1にいる時に取れる戦略全体の集合をそれぞれテンプレート:Mvarテンプレート:Mvarと表記する。このとき、非対称なゲームの戦略空間は

X0×X1

である。戦略空間の元(σ,τ)X0×X1の直観的意味は「もし自分が立場0であれば戦略テンプレート:Mvarを取り、立場1であれば戦略テンプレート:Mvarを取る」というものである。

このゲームにおける個体群戦略(σ1,τ1),,(σm,τm)X0×X1ε1,,εm[0,1]ε1++εm=1)を用いて

i=1mεiδ(σi,τi)

と書けるものを指す。ゲームは非対称であるので、利得関数も自分が立場0にいるときと立場1にいるときで異なる。自分が立場k=0,1にいるときの利得関数を

k(ξ,i=1mεiδσi)

と書く。ここでテンプレート:Mvarテンプレート:Mvarの元であり、σ1,,σmX1kの元である。非対称なゲームは組

((X0,0),(X1,1))

により定義される。

対称化

以上のように定義された非対称なゲーム((X0,0),(X1,1))に対し、利得関数の対称化を行う。このために記号を導入する。個体群戦略

Π=iεiδ(σi,τi)

に対し、

π0(Π)=iεiδσi
π1(Π)=iεiδτi

と書くことにする。関数

ρ:X0×X1[0,1]

を一つ固定するとき、利得関数の組(0,1)ρにより対称化した利得関数

((ξ0,ξ1),Π)=ρ(ξ0,ξ1)0(ξ0,π1(Π))+(1ρ(ξ0,ξ1))1(ξ1,π0(Π))

により定義する[38]。直観的にはρ(ξ0,ξ1)は個体戦略(ξ0,ξ1)X0×X1を取っている個体が立場0になる確率である。

なお、対称化が定数関数

ρ=const.

を用いて行われた場合、この対称化は戦略-立場独立(strategy-role independent[38])であるという。

進化的安定性

非対称なゲームに関する進化的安定性は、対称化したゲームの進化的安定性により定義する。すなわち個体戦略(ξ*,ν*)X1×X2進化的安定であるとは、戦略空間がX1×X2であり利得関数がであるゲームに関して進化的安定である事を指す[38]。もちろんこの進化的安定性の概念は関数ρに依存しており、ρが異なれば進化的安定性の概念も異なる。

一般化

これまで非対称なゲームを考察するに当たって、同じ立場にいる個体同士が闘争しないことを暗に仮定していた。すなわち、自分が立場0にいる時は立場1にいる個体と闘争し、立場1にいるときは立場0にいる個体と闘争する、という事である。しかし一般にはこれが成立しない場合もある。この場合には、4つの利得関数00,10,01,11を考え、

((ξ0,ξ1),Π)=i,jρi,j(ξ0,ξ1)i,j(ξi,πj(Π))

として対称化をはかる[39]。ここでρi,j:X0×X1[0,1]i,jρi,j(ξ0,ξ1)=1を満たす関数である。

直観的にはijは自分が立場テンプレート:Mvar、闘争相手が立場テンプレート:Mvarにいるときの利得関数で、ρi,j(ξ0,ξ1)は自分が個体戦略(ξ0,ξ1)X0×X1を取っている際に、自分が立場テンプレート:Mvar、闘争相手が立場テンプレート:Mvarになる確率である。


レプリケーター方程式(Replicator Equation)と進化的安定性

レプリケーターダイナミクス(replicator dynamics、自己複製子動学[40])は与えられた個体群内の各個体が取る戦略の頻度分布(すなわち、前章までの言葉で言えば個体群戦略)がどのように時間発展するかを定式化したモデルで、このモデルにおいて頻度分布の時間発展を記述する方程式をレプリケーター方程式(replicator equation)という。本節では「離散型」、「連続型」の2種類のレプリケーター方程式を紹介し、行列ゲームにおいて連続レプリケーター方程式の解の収束先と進化的安定性の関係を述べる。


レプリケーター方程式

本節では以下の2種類のレプリケーター方程式を紹介する:

  • 離散レプリケーター方程式(discrete replicator equation):無性生殖する個体群の戦略の頻度分布を(オーバーラップのない)「世代」という離散的な時間で記述できると仮定した場合の方程式[41]
  • 連続レプリケーター方程式(continuous replicator equation):個体数が十分大きいため世代がオーバーラップし、連続的な時間によって(無性生殖する)個体群の戦略の頻度分布を記述できると近似した場合における方程式[41]

離散レプリケーター方程式

離散レプリケーター方程式を定式化するために、以下のような個体群を考える:

  1. 個体群の構成が世代テンプレート:Mathによって記述でき、各世代にはオーバーラップがない。すなわち世代テンプレート:Mvarに生きた個体はテンプレート:Mathには全て死滅し、世代テンプレート:Mathは世代テンプレート:Mvarに生まれた個体の子供のみから構成される[41]
  2. 個体群内の各個体は有限個の純粋戦略テンプレート:Mathのいずれかを取り、混合戦略は取らない[41]
  3. この個体群は無性生殖によって子孫を残す[41]
  4. この個体群には突然変異が生じないもの[41]


この個体群において世代テンプレート:Mvarで(純粋)戦略テンプレート:Mvarを取る個体の割合をpi(t)と表記すると、この個体群における戦略の分布

𝐩(t)=(p1(t),,pn(t))

と記述できる[注 2]

この個体群で戦略テンプレート:Mvarを取る各個体の利得をfi(𝐩(t))と表記し、fi(𝐩(t))に関して以下の仮定を置く:

このように仮定すると、個体群のうち割合pi(t)の個体が、それぞれfi(𝐩i(t))の子供を残すのだから、世代テンプレート:Mathにおいて戦略テンプレート:Mathを取る個体の比率は

p1(t)f1(𝐩(t))::pn(t)fn(𝐩(t))

となる。ここで我々は

  • 仮定3.により、(突然変異を例外とすれば)子供は親と同じ遺伝子を持つため、親と同じ戦略を取り
  • 仮定4.により突然変異が起こらない

事を利用した。以上より世代世代テンプレート:Mathにおいて戦略テンプレート:Mvarを取る個体の割合は、以下の離散レプリケーター方程式に従う[41]

pi(t+1)=fi(𝐩(t))f¯(𝐩(t))pi(t)for i=1,,n

ここで

f¯(𝐩(t))=jpj(t)fj(𝐩(t))

である[41]

離散レプリケーター方程式の分母

分数は分母だと意味を持たないので、最後に離散レプリケーター方程式の分母について触れておく。離散レプリケーター方程式の直観的な意味から、利得の期待値fi(𝐩(t))

fi(𝐩(t))0

を満たす必要がある。またpi(t)は割合であったので1pi(0)0であり、数学的帰納法により、離散レプリケーター方程式の分母が0になる世代テンプレート:Mvarの直前までは

1pi(t)0

が成立する事も示せる。したがって離散レプリケーター方程式の分母が0になる場合、すなわち

f¯(𝐩(t))=jpj(t)fj(𝐩(t))=0

の場合は、正の数の和が0である事になるので、

p1(t)f1(𝐩(t))==pn(t)fn(𝐩(t))=0

が成立する。これは各テンプレート:Mvarに対し、pi(t)fi(𝐩(t))のいずれかが0である事を意味する。pi(t)=0であれば、純粋戦略テンプレート:Mvarを取る個体は絶滅した事になるので、任意のテンプレート:Mvarに対し、pi(s)=0である。またfi(𝐩(t))=0であれば、純粋戦略テンプレート:Mvarを取る個体が世代テンプレート:Mvarで残せた子供の数fi(𝐩(t))が0である事を意味するので、やはり任意のテンプレート:Mvarに対し、pi(s)=0である。結局、離散レプリケーター方程式の分母が0になるという事は個体群の全ての個体が絶滅した場合に相当する。

連続レプリケーター方程式

連続レプリケーター方程式を定式化する為、離散レプリケーター方程式の節の2~4の仮定と以下の1'の仮定を満たす個体群を考える:

1'. 個体数が十分大きいため世代がオーバーラップし、連続的な時間によって個体群の戦略の頻度分布を記述できる[41]

前節同様、(純粋)戦略テンプレート:Mvarを取る個体の割合をpi(t)と表記し、𝐩(t)=(p1(t),,pn(t))とし、この個体群で戦略テンプレート:Mvarを取る各個体の利得をfi(𝐩(t))と表記する。

利得fi(𝐩(t))に関して前節のものと似た以下の仮定を置く:

個体群に属する個体数が十分に大きいと仮定しているので、個体数テンプレート:Mvarテンプレート:Mvarに関して微分可能な連続量であるとみなして差し支えないので[41]Ni(t)=pi(t)N(t)とすると、上述の仮定から、

ddtNi(t)=fi(𝐩(t))Ni(t)テンプレート:EquationRef

が成立する[41]。記号を簡単にするため、時間微分をN˙i(t)のようにドットで書くことにすると、テンプレート:EquationNoteNi(t)=pi(t)N(t)より、

p˙i(t)=ddt(Ni(t)N(t))=N˙i(t)pi(t)N˙(t)N(t)=fi(𝐩(t))Ni(t)pi(t)N˙(t)N(t)=pi(t)(fi(𝐩(t))N˙(t)N(t))

が成立し、しかもテンプレート:EquationNoteから

N˙(t)N(t)=jN˙j(t)N(t)=jfj(𝐩(t))pj(t)

でもあるので、以下の連続レプリケーター方程式が成立する[41]

dpidt(t)=(fi(𝐩(t))f¯(𝐩(t)))pi(t)for i=1,,n

ここで

f¯(𝐩(t))=jpj(t)fj(𝐩(t))

である[41]。なお、適切な条件下では離散レプリケーター方程式の極限として連続レプリケーター方程式が得られる事が知られている[41][42]

行列ゲームの連続レプリケーター方程式と進化的安定性

本節の目標は、行列ゲームに対し、レプリケーター方程式の解が進化的安定な状態へと収束する条件を見る事である。なお、行列ゲーム以外のゲームに関してはこのような収束性は成り立つとは限らない[43]。その理由の一端は、(後述するように)レプリケーター方程式が純粋戦略のみを取る個体群を想定しているのに対し、進化的安定性の定義では混合戦略をも考慮する事が多いからである[43]。したがって単型-多型同値が成り立たない系では、レプリケーター方程式による解析と進化的安定性とが一致しない可能性がある[43]

行列ゲームにおける連続レプリケーター方程式

まず行列ゲームに対する連続レプリケーター方程式を記述する。テンプレート:Mathの行列A=(aij)i,jテンプレート:Mvar行の縦ベクトルテンプレート:Mvarに対し、積テンプレート:Mvarの第テンプレート:Mvar行を

(A𝐩)i

という記号で書くことにすると、利得関数が

E(i,j)=aij

と記述できる行列ゲームにおいて、純粋戦略テンプレート:Mvarを取る個体の利得の期待値fi(𝐩(t))は明らかに

fi(𝐩(t))=(A𝐩(t))i

なので、行列ゲームにおける連続レプリケーター方程式は

dpidt(t)=((A𝐩(t))i𝐩(t)TA𝐩(t))pi(t)for i=1,,n  …テンプレート:EquationRef

と記述できる[41][44]。ここで𝐩(t)T𝐩(t)転置した横ベクトルである。

解の性質

本節ではテンプレート:EquationNoteと進化的安定性の関係性を調べるため、テンプレート:EquationNoteに関する性質を述べる。まずpi(t)は純粋戦略テンプレート:Mvarを取る個体の割合であったから、𝐩(t)の初期値𝐩(0)

Δn={(pi)i=1,,n|0p1,,pn1,i=1npi=1}    ...(テンプレート:EquationNote、再掲)

の元である。テンプレート:EquationNoteは行列によって記述できる常微分方程式であるので、(少なくとも初期値の近傍では)解が存在し、しかもその解は一意である(Picard–Lindelöf theorem[45]

解の一意性から、テンプレート:EquationNoteにおける時間発展で2つの超平面

{(pi)i=1,,n|i=1npi=1}
{(pi)i=1,,n|pi=0}

が保存される事を簡単に示せるので、以下が明らかに従う[46]テンプレート:Math theoremここから明らかに次の系が従う[46]テンプレート:Math theoremΔnコンパクトであるので、以上の性質と前述の解の局所的存在性・一意性から次が従う:テンプレート:Math theorem次の事実も知られている[47]テンプレート:Math theorem

進化ゲーム理論のフォーク定理

テンプレート:EquationNoteと進化的安定性の関係を述べるため、以下の概念を定義する。なお以下で、𝐩(t)は初期値が𝐩(0)であるときのテンプレート:EquationNoteの(必ず存在する一意な)解である[46]テンプレート:Math theoremなお大域的安定性の定義でΔnの境界Δnの点に対して𝐩0への収束性を求めないのは、テンプレート:EquationNoteで述べたように、Δnの点はテンプレート:EquationNoteにおける時間発展でΔnに留まり続ける為、𝐩0に収束することはありえないからである[46]


このとき次が成立する[46][43]。なおゲーム理論にも「フォーク定理」という名称の定理があるが、下のものはこれとは無関係の定理である[注 3]
テンプレート:Math theoremすでに述べたように行列ゲームにおいては

狭義ナッシュ均衡⇒進化的安定⇒ナッシュ均衡

という関係性が成立するので、上述の定理から連続レプリケーター方程式の解と進化的安定性との関係がある程度わかる事になる。

また以下も成立する[43]テンプレート:Math theorem

行列ゲームの混合戦略に対する連続レプリケーター方程式と進化的安定性

混合戦略に対する連続レプリケーター方程式

これまで我々は、着目している個体が純粋戦略を取る場合の連続レプリケーター方程式に関して考察してきたが、より一般に、有限個の混合戦略𝐪1,,𝐪mΔnを取る個体がそれぞれ割合x1(t),,xm(t)で存在する個体群に対する連続レプリケーター方程式を考える事もできる[48]

dxidt(t)=(𝐪i𝐪𝐱(t))TA𝐪𝐱(t))xi(t)for i=1,,m  …テンプレート:EquationRef

ここで𝐪𝐱(t)平均混合戦略[49]

𝐪𝐱(t)=j=1mxj(t)𝐪j  …

である[48]テンプレート:EquationNoteの導出はテンプレート:EquationNoteのそれと同様なので省略する。

進化的安定性との関係

テンプレート:EquationNoteにおいてテンプレート:Mathであれば、x=x1(t)𝐪=𝐪1𝐪^=𝐪2と略記すると、x2=1xなので、テンプレート:EquationNoteに登場するテンプレート:Math本の式はいずれも

x˙=x(1x){x(𝐪𝐪^)TA𝐪+(1x)(𝐪𝐪^)TA𝐪^)}  …テンプレート:EquationRef 

に同値である事が簡単な計算から確かめられる[48]。このとき、次が成立する事が知られている[48]テンプレート:Math theorem

行列ゲームの混合戦略に対する離散レプリケーター方程式と進化的安定性

行列ゲームの純粋戦略に対する離散レプリケーター方程式

混合戦略に関して考察する前に、まず本節では行列ゲームの純粋戦略に対する離散レプリケーターを導出する。純粋戦略テンプレート:Mvarを取る個体の割合をpi(t)と表記し、𝐩(t)=(p1(t),,pn(t))とし、この個体群で戦略テンプレート:Mvarを取る各個体の利得をfi(𝐩(t))と表記する。

テンプレート:Mathの行列A=(aij)i,jを用いて利得関数が

E(i,j)=aij

と書ける行列ゲームにおいて、純粋戦略テンプレート:Mvarを取る個体の利得の期待値fi(𝐩(t))は明らかに

fi(𝐩(t))=(A𝐩(t))i

なので、これを利用して離散レプリケーター方程式の具体的な形を書き下す事ができる。より一般に各個体が行列ゲームの利得以外に「背景利得」(background payoff)テンプレート:Mvarを得られる場合、すなわち

fi(𝐩(t))=(A𝐩(t))i+β

の場合には、離散レプリケーター方程式の具体的な形は

pi(t+1)=(A𝐩(t))i+β𝐩(t)TA𝐩(t)+βpi(t)for i=1,,n   …テンプレート:EquationRef 

である[41][50]

行列ゲームの混合戦略に対する離散レプリケーター方程式

連続レプリケーター方程式の「純粋戦略版」であるテンプレート:EquationNoteから「混合戦略版」のテンプレート:EquationNoteを導いたのと同様の方法で、離散レプリケーター方程式の「混合戦略版」を「純粋戦略版」であるテンプレート:EquationNoteから導くことができる。

すなわち、有限個の混合戦略𝐪1,,𝐪mΔnを取る個体が世代テンプレート:Mvarにおいてそれぞれ割合x1(t),,xm(t)だけ存在する個体群を考え、𝐱(t)=(x1(t),,xm(t))Tとするとき、混合戦略𝐪iを取る個体の利得の期待値fi(𝐱(t))平均混合戦略[49]

𝐪𝐱(t)=j=1mxj(t)𝐪j  …

を用いて

fi(𝐱(t))=jxj(t)E(𝐪i(t),𝐪j(t)))+β=𝐪i(t)TA𝐪𝐱(t)+β

と表記できるので、

xi(t+1)=𝐪iTA𝐪𝐱(t)+β𝐪𝐱TA𝐪𝐱(t)+βxi(t)for i=1,,m   …テンプレート:EquationRef 

となる。なおテンプレート:EquationNoteより明らかに比の等式

x1(t+1)x1(t)::xm(t+1)xm(t)=E(𝐪1,𝐪𝐱(t))::E(𝐪m,𝐪𝐱(t))   …テンプレート:EquationRef 

が成立する。ここで

E(𝐩,𝐪)=𝐩TA𝐪+βテンプレート:EquationRef 

である。上の比の等式は左辺に登場する分母xi(t)が0である場合は意味を持たないが、前節でも述べたのと同様の議論により、xi(t)が0になるのは混合戦略𝐪iを取る個体が個体群から絶滅した事を意味するので、以降のテンプレート:Mvarに関しては常にxi(s)=0であるものと解釈する。

進化的安定性との関係性

離散レプリケーター方程式と進化的安定性との関係を見るため、テンプレート:EquationNoteテンプレート:Mathであるケースを考え、x(t)=x1(t)𝐪=𝐪1𝐪^=𝐪2と略記すると、x2(t)=1x(t)なので

x(t+1)x(t):1x(t+1)1x(t)=E(𝐪,𝐪𝐱(t)):E(𝐪^,𝐪𝐱(t))  …テンプレート:EquationRef 

である[49]。ここでテンプレート:Mvarテンプレート:EquationNoteのように定義されており、

𝐪𝐱(t)=x(t)𝐪+(1x(t))𝐪^  …

であり、テンプレート:EquationNoteの左辺の分母が0である場合の解釈は前節と同様であるものとする。また離散レプリケーター方程式の利得は子供の数を示していたので、

E(𝐪,𝐪),E(𝐪^,𝐪^)0 

が成立する事を仮定する。このとき、次が成立する[49]テンプレート:Math theorem

上述の定理は、個体群において𝐪𝐪^を取る個体の割合が進化的安定戦略𝐪^の侵入障壁よりも小さい時は、世代を重ねる事で𝐪を取る個体の割合が0に収束していく事を意味する。

テンプレート:Math proof

年表

脚注

テンプレート:脚注ヘルプ

注釈

テンプレート:Notelist2

出典

テンプレート:Reflist

参考文献

引用文献

本稿全般に対する参考文献として下記のものがある:

その他にも下記を参考にしたが、上に挙げたものの方がより詳しく記述されているため、参考にした箇所は限定的である:

本稿で用いたゲーム理論の知識はどの教科書にも載っている初歩的な話に限定されているので、個別に引用する事はしなかったが、例えば下記の文献が参考になる(ただし進化的安定性については12章にお話的な記載があるのみ):

原論文

さらなる理解の為に

外部リンク

テンプレート:ゲーム理論 テンプレート:Normdaten

  1. 1.0 1.1 1.2 SP73
  2. 2.0 2.1 本節は巌佐98 p211-214を参照した。なお、巌佐98がここで出している例はジョン・メイナード=スミスジョージ・プライスの原論文(SP73)から引用したものである。
  3. SP73 p16
  4. 巌佐98 p212
  5. HS88JCL14 p995からの重引)、A10 p13
  6. 6.0 6.1 M16 p4
  7. 7.0 7.1 PS94 p940
  8. 8.0 8.1 M16 p10
  9. 本節はA10 p13を参考にした
  10. 10.0 10.1 M07 p7
  11. BR13 p.96.
  12. M07 p3
  13. 13.0 13.1 CA16 p9。
  14. 14.0 14.1 14.2 PS94 p937, 939-940
  15. 15.0 15.1 A10 p18
  16. 巌佐98 p213
  17. M16 p.2.
  18. 18.0 18.1 M07 p.5.
  19. BR13 p.59
  20. BR13 p.13.
  21. BR13 pp.14-15.
  22. BR13 p.25.
  23. 23.0 23.1 BR13 p.121.
  24. 24.0 24.1 PS94 p.936
  25. BR13 p.26.
  26. BR13 p.37.
  27. BR13 p.94.
  28. 28.0 28.1 28.2 28.3 28.4 BR13 p.122.
  29. 29.0 29.1 BR13 pp.122-123.
  30. BR13 pp.21, 122-123.
  31. BR13 p.125.
  32. S07 p.10.
  33. 33.0 33.1 33.2 粕谷90 p.40.
  34. 34.0 34.1 S82 位置311
  35. BR13 p.127.
  36. S07 p.11.
  37. BR13 p.126.
  38. 38.0 38.1 38.2 BR13 p.142.
  39. BR13 p.144.
  40. テンプレート:Cite web
  41. 41.00 41.01 41.02 41.03 41.04 41.05 41.06 41.07 41.08 41.09 41.10 41.11 41.12 41.13 41.14 41.15 BR13 pp.29-31.
  42. PS94 p.949.
  43. 43.0 43.1 43.2 43.3 43.4 BR13 p.43.
  44. HS03 p.481.
  45. テンプレート:Cite web
  46. 46.0 46.1 46.2 46.3 46.4 HS03 p.482.
  47. HS03 p.484.
  48. 48.0 48.1 48.2 48.3 HS03 p.486.
  49. 49.0 49.1 49.2 49.3 PS94 pp.938-940
  50. HS03 p.503.
  51. S72
  52. S74
  53. S82


引用エラー: 「注」という名前のグループの <ref> タグがありますが、対応する <references group="注"/> タグが見つかりません