3囚人問題

提供: testwiki
ナビゲーションに移動 検索に移動

テンプレート:混同

3囚人問題(さんしゅうじんもんだい、テンプレート:Lang-en-short)は確率論の問題で、マーティン・ガードナーによって1959年に紹介された[1][2]。「テンプレート:仮リンク」を下敷きにしていると考えられている。

概要

ある監獄にA、B、Cという3人の囚人がいて、それぞれ独房に入れられている。罪状はいずれも似たりよったりで、近々3人まとめて処刑される予定になっている。ところが恩赦が出て3人のうちランダムに選ばれた1人だけ助かることになったという。誰が恩赦になるかは明かされておらず、それぞれの囚人が「私は助かるのか?」と聞いても看守は答えない。したがって囚人Aが恩赦になる確率はこの時点では1/3であると考えられる。

囚人Aは一計を案じ、看守に向かってこう頼んだ。「BとCのどちらが処刑されるかだけでも教えてくれないか?」すると看守は「Bは処刑される」と教えてくれた。

それを聞いた囚人Aはひそかに喜んだ。Bが死刑になる事は確定した以上、恩赦になるのはAかCのいずれか一方であるはずであり、したがってAが恩赦になる確率は1/2に上昇したからである。

果たして囚人Aが喜んだのは正しいか?

解法

結論を述べるためにまず記号を定義し、簡単な考察をする。「Aが恩赦になる」、「Bが恩赦になる」、「Cが恩赦になる」という事象を略記してそれぞれA、B、Cと書き、「看守が「Bは死刑になる」と答える」という事象をbとする。

看守はA自身が死刑になるか否かを答えないのであるから、恩赦になるのがBの場合、看守は必ず「Cは死刑になる」と答える。同様の理由により、恩赦になるのがCの場合、看守は必ず「Bは死刑になる」と答える。すなわち、

Pr[bB]=0,Pr[bC]=1   …①

である。

しかし恩赦を受けるのがA自身であるケースでは、看守は「Bは死刑になる」という回答と「Cは死刑になる」という回答のいずれを答えるか任意に選ぶ事ができる。すなわち、

Pr[bA]

がいくつになるのかは3囚人問題のセッティングのみからは決まらず、看守の性格や思考等に依存して決まる。従って看守の答えを聞いて囚人Aが喜んだのが正しいか否かは、このPr[bA]がどのような値になるのかに依存して異なる[3]

 これをみるために「Bは死刑になる」と看守から聞いた後Aが恩赦になる事後確率Pr[Ab]を求める。恩赦がランダムに決まるという仮定より

Pr[A]=Pr[B]=Pr[C]=13    …②

であるので、ベイズの定理より、

Pr[Ab]=Pr[bA]Pr[A]Pr[b]=Pr[bA]Pr[A]Pr[bA]Pr[A]+Pr[bB]Pr[B]+Pr[bC]Pr[C]=(2)Pr[bA]Pr[bA]+Pr[bB]+Pr[bC]=(1)Pr[bA]Pr[bA]+1 

である[3]。具体的な値をいくつか代入してみると、

Pr[Ab]={12if Pr[bA]=113if Pr[bA]=120if Pr[bA]=0. 

したがって最初に述べたように、「Bは死刑になる」と看守から聞いた後Aが恩赦になる事後確率Pr[Ab]は、Aが恩赦されるケースで看守が「Bが死刑となる」と答える確率Pr[bA]に依存して値が変わる。

もしAが確率Pr[bA]に関して何ら情報を持たないなら、Pr[bA]=12と仮定するのは自然である(最大エントロピー原理)[3]。この場合には、看守の返答後にAが恩赦になる確率 Pr[Ab]は 1/3のままである。すなわち「恩赦の確率が1/2にあがった」という囚人Aが喜んだのは間違っている事になる。 

しかしAがPr[bA]に関する何らかの情報(例えば「看守はBを嫌っている」という情報)を持っている場合は、必ずしもPr[bA]=12とするのは自然ではない[3]

仮にPr[bA]=1であれば、 Pr[Ab]=12 となる為、囚人Aが喜んだのは正しい事になる。  一方Pr[bA]=0であればPr[Ab]=0 より、看守の返答を聞いたことによりAが恩赦になる確率は0に下がってしまう

恩赦が等確率でない場合

上ではA、B、Cが恩赦を受ける確率はいずれも1/3である事を仮定し、Pr[bA]=12なら囚人が喜んだのは間違っている事を見た。

しかし例えば、恩赦になる確率だけをそれぞれA=1/4、B=1/4、C=1/2に変えると、(Pr[bA]=12であっても)看守が「Bは死刑になる」と答えることでAの恩赦確率は1/5とかえって低下してしまう[4][5]

心理学の題材として

直感的・主観的に捉えて予想した確率と本当の確率テンプレート:Efnが一致しないのはなぜか、さらに、解答を説明されても即座に理解できなかったり、理解したつもりでも納得できないのはなぜか、という研究が認知心理学の研究分野で行われた。

看守の返答を聞いた後Aが恩赦になる確率のアンケートを行ったある研究テンプレート:Efnでは、回答者の76%が1/2、14%が1/3と解答している[5]。しかし、確率は統計に基づくことを説明するヒントを載せたところ、この比率は逆転した[5]

脚注

テンプレート:脚注ヘルプ

注釈

テンプレート:Notelist

出典

関連項目