質的応答均衡のソースを表示
←
質的応答均衡
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
{{出典の明記|date=2016-5-30}} {{脚注の不足|date=2016-5-30}} '''質的応答均衡'''(しつてきおうとうきんこう、{{lang-en-short|Quantal response equilibrium}}、 '''QRE''')とは、[[ゲーム理論]]における[[解概念]]のひとつ。{{仮リンク|リチャード・マッケルヴィ|en|Richard McKelvey}}と{{仮リンク|トーマス・パルフレイ|en|Thomas Palfrey}}によってはじめて導入され、[[限定合理性]]のもとでの均衡概念を与えた。質的応答均衡は均衡の精緻化ではなく、[[ナッシュ均衡]]とはかなり違った結果を与えている。質的応答均衡は離散的な戦略についてのみ定義されているが、連続な戦略についても類似のものがある。 質的応答均衡において、プレーヤーたちはどの純粋戦略をプレーするか選ぶにあたって誤りを犯すものと仮定されている、特定の戦略が選ばれる確率は、その戦略がもたらす利得の大きさと正の相関をもつ。言いかえると、犠牲の大きい誤りは起こりにくい。 この均衡は信念が実現することから生ずる。プレーヤーの利得は、戦略の上の他のプレーヤーの確率分布に関する信念にもとづいて計算される。均衡においては、プレーヤーの信念は正しい。 == データへの応用 == 実際のゲームのプレー(とくに、[[実験経済学|実験室実験]])から得られたデータを解析すると、ナッシュ均衡は厳しいのかもしれない。どんな非均衡行動も同じように「間違っている」ように見えるが、現実的には、理論を棄却するために用いられるべきではない。質的応答均衡は、どの戦略も正確率でプレーされることを許容し、したがってどんなデータも不可能とはしない(そうかといってかならずしも合理的ともしない)。 == ロジット均衡 == 質的応答均衡でもっとも一般的なものは間違いなく'''ロジット均衡''' (logit equilibrium: '''LQRE''') である。ロジット均衡では、プレーヤーの戦略は確率分布に従って選ばれる。 : <math>P_{ij} = \frac{\exp (\lambda EU_{ij} (P_{-i}))}{\displaystyle \sum_k {\exp (\lambda EU_{ik} (P_{-i}))}}</math> : <math>P_{ij}</math> は,プレーヤー <math>i</math> が戦略 <math>j</math> を選ぶ確率。 : <math>EU_{ij} (P_{-i})</math> は,プレーヤー <math>i</math> が戦略 <math>j</math> を選ぶとき、他のプレーヤーが確率分布 <math>P_{-i}</math> に従ってプレーしていることを所与としたときに得られる期待利得。 ロジットモデルにおいてとくに興味があるのは、非負のパラメータ <math>\lambda</math> である(これはときに <math>1 / \mu</math> と書かれる)。<math>\lambda</math> は合理性のパラメータと考えられる.<math>\lambda \to 0</math> となるにつれて、プレーヤーは「完全に非合理的」になり、どの戦略も等確率でプレーするようになる。<math>\lambda \to \infty</math> となるにつれて、プレーヤーは「完全に合理的」になり、ゲームのプレーはナッシュ均衡に近づく。 == 動学ゲームに対して == 動学([[展開型ゲーム|展開形]])ゲームに対して、マッケルヴィとパルフレイは'''エージェント質的応答均衡''' (agent quantal response equilibrium: '''AQRE''') を定義した。AQRE はいくぶん[[部分ゲーム完全均衡|部分ゲーム完全化]]に似ている。AQRE において、各プレーヤーはQREのようにある誤りを犯す。所与の決定節において、プレーヤーは、将来の自分を、行動のうえに既知の確率分布をもった独立のプレーヤーとみなして、各行動の与える期待利得を決定する。 QREにおいてそうだったように、AQREでは、どの戦略も正の確率で用いられる。このことは、完全合理的な解概念に比べて、AQREに追加的な利点を与える。任意の経路がある確率で実現するのだから、「均衡経路外」における信念を定義するにあたって何の問題も生じないのである。 == 批判 == === 自由パラメータ === LQRE には自由パラメータ <math>\lambda</math> がある.<math>\lambda \to \infty</math> とすると LQRE はナッシュ均衡に近づく。したがってLQREはつねに、少なくともナッシュ均衡と同じくらいはあてはまりがよいことになる。パラメータを変化させると、均衡行動に大きな変化が起こることになる。 しかしながら、この理論は、<math>\lambda</math> がどこからくるのかを説明しないことには不完全である。実験からの <math>\lambda</math> の推定値は著しく変動しうる。あるときにはこの変動は、個人の特性の効果であるようにみえる(たとえば<math>\lambda</math>はときに学習によって増加する)。別の場合には <math>\lambda</math> は、ゲームに応じて変化するようにもみえる。 == 参考文献 == {{参照方法|date=2016-5-30}} * {{Citation | last1 = McKelvey | first1 = Richard | author1-link = Richard McKelvey | last2 = Palfrey | first2 = Thomas | author2-link = Thomas Palfrey | title = Quantal Response Equilibria for Normal Form Games | journal = Games and Economic Behavior | volume = 10 | pages = 6–38 | year = 1995 | doi = 10.1006/game.1995.1023 }} * {{Citation | last1 = McKelvey | first1 = Richard | author1-link = Richard McKelvey | last2 = Palfrey | first2 = Thomas | author2-link = Thomas Palfrey | title = Quantal Response Equilibria for Extensive Form Games | journal = Experimental Economics | volume = 1 | pages = 9–41 | year = 1998 | doi = 10.1007/BF01426213 }} {{ゲーム理論}} {{DEFAULTSORT:しつてきおうとうきんこう}} [[Category:ゲーム理論]]
このページで使用されているテンプレート:
テンプレート:Citation
(
ソースを閲覧
)
テンプレート:Lang-en-short
(
ソースを閲覧
)
テンプレート:ゲーム理論
(
ソースを閲覧
)
テンプレート:仮リンク
(
ソースを閲覧
)
テンプレート:出典の明記
(
ソースを閲覧
)
テンプレート:参照方法
(
ソースを閲覧
)
テンプレート:脚注の不足
(
ソースを閲覧
)
質的応答均衡
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報