超幾何分布のソースを表示
←
超幾何分布
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
{{確率分布 |名前 = 超幾何分布 |型 = 質量 |画像/確率関数 = [[File:HypergeometricPDF.png|300px|Hypergeometric PDF plot]] |画像/分布関数 = [[File:HypergeometricCDF.png|300px|Hypergeometric CDF plot]] |母数 = <math>\begin{align} N &\in \left\{ 0,1,2,\cdots \right\} \\ K &\in \left\{ 0,1,2,\cdots ,N\right\} \\ n &\in \left\{ 0,1,2,\cdots ,N\right\} \end{align}</math> |台 = <math>\left\{ \max \{0,\, n+K-N\} ,\, \cdots ,\, \min \{ n,\, K \} \right\}</math> |確率関数 = <math>\frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}}</math> |分布関数 = <math>1-\frac{\binom{n}{k+1} \binom{N-n}{K-k-1}}{\binom{N}{K}} \, {}_3 \! F_2 \! \! \left[ \begin{array}{c} 1,\ k+1-K,\ k+1-n \\ k+2,\ N+k+2-K-n \end{array} ;1\right],</math> <math>{}_p \! F_q</math> は[[一般超幾何関数]] |期待値 = <math>n {K\over N}</math> |中央値 = |最頻値 = <math>\left\lfloor \frac{(n+1)(K+1)}{N+2} \right\rfloor</math> |分散 = <math>n\frac{K}{N} \frac{N-K}{N} \frac{N-n}{N-1}</math> |歪度 = <math>\frac{(N-2K)(N-1)^\frac{1}{2} (N-2n)}{[nK(N-K)(N-n)]^\frac{1}{2} (N-2)}</math> |尖度 = <math>\left. \frac{1}{nK(N-K)(N-n)(N-2)(N-3)} \cdot \right.</math> <math>\Big[ (N-1)N^2 \Big( N(N+1)-6K(N-K)-6n(N-n)\Big) +</math> <math>6nK(N-K)(N-n)(5N-6)\Big]</math> |エントロピー = |モーメント母関数 = <math>\frac{\binom{N-K}{n} \scriptstyle{{}_2 \! F_1 (-n,-K;N-K-n+1;e^t)}}{\binom{N}{n}}</math> |特性関数 = <math>\frac{\binom{N-K}{n} \scriptstyle{{}_2 \! F_1 (-n,-K;N-K-n+1;e^{it} )}}{\binom{N}{n}}</math> }} '''超幾何分布'''(ちょうきかぶんぷ、{{lang-en-short|hypergeometric distribution}})とは、成功状態をもつ[[母集団]]から非復元抽出したときに成功状態がいくつあるかという[[確率]]を与える[[離散確率分布]]の一種である。男女・合否などのように2種の排他的属性に分割できる有限母集団からの非復元抽出に適用される。超幾何分布と対照的<ref group="注">二項分布は超幾何分布の定義における「非復元抽出」を「復元抽出」に置き換えたものに相当する。</ref>な[[確率分布]]には[[二項分布]]がある。 == 定義 == '''超幾何分布'''とは {{mvar|K}} 個の成功状態をもつ {{mvar|N}} 個の要素よりなる[[母集団]]から {{mvar|n}} 個の要素を非復元抽出したときに {{mvar|k}} 個の成功状態が含まれている[[確率]]を与える[[離散確率分布]]の一種である。超幾何分布に従う[[確率変数]] {{mvar|X}} の[[確率質量関数]] {{mvar|f{{sub|X}}}} は次で与えられる。 :<math>\operatorname{P} (X=k)=f_X (k;N,K,n)=\frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}}=\frac{\binom{n}{k} \binom{N-n}{K-k}}{\binom{N}{K}}</math> 確率質量関数は {{math2|max{0, ''n'' + ''K'' − ''N''{{)}} ≤ ''k'' ≤ min{''K'', ''n''{{)}}}} のとき正となる。 超幾何分布は {{mvar|N}} が大きくなると、[[二項分布]]に近づく。また {{math|{{sfrac|''K''|''N''}}}} が小さく、抽出数 {{mvar|n}} が大きいとき、[[ポアソン分布]]に近づく。 == 性質 == * 期待値 <math>E(X)=n \cdot \frac{K}{N}</math> * 分散 <math>\operatorname{Var} (X)=n \cdot \frac{K}{N} \cdot \frac{N-K}{N} \cdot \frac{N-n}{N-1}</math> * 最頻値 <math>\left\lfloor \frac{(n+1)(K+1)}{N+2} \right\rfloor</math> * 対称性 <math>\begin{align} f_X (k;N,K,n) &=f_X (k;N,n,K) \\ &=f_X (n-k;N,N-K,n) \\ &=f_X (K-k;N,K,N-n) \end{align}</math> == 例 == 例えば、赤い玉10個と白い玉20個を混ぜた、計30個の玉を入れた[[壺問題|壺]]の中から5個の球を取り出すとき、赤い玉がちょうど1つである確率は :<math>\frac{\binom{10}{1} \binom{30-10}{5-1}}{\binom{30}{5}} =\frac{8075}{23751} \approx 0.34</math> 赤い玉の個数の期待値は :<math>\frac{5\times 10}{30} \approx 1.67</math> === フィッシャーの正確確率検定への応用 === {{See also|フィッシャーの正確確率検定|壺問題}} '''元々、N個のビー玉が壺の中に入っていて、そのうち緑玉がK個、赤玉はN-K個であったとする。この中から(目を瞑って)n個のビー玉を[[非復元抽出]]で取り出したとする。このとき、(n回の試行のうち)緑玉がk回取り出される確率を求めたい。'''なお、壺には緑玉と赤玉以外には入っておらず、同色同士の玉は区別できないものとする。 この問題において、「成功」を「緑玉」に、「失敗」を「赤玉」例えることで、超幾何分布の問題に帰着でき、k回成功する確率(即ち、k回緑玉が取り出される確率)は、以下のようになる。 :<math> P(X=k) = f(k;N,K,n) = {{{K \choose k} {{N-K} \choose {n-k}}}\over {N \choose n}}.</math> この確率は普通の仮説検定で有意差を表す「p値」とは違い、p値を求めるには(普通の検定と同じように)実際の観測データよりも極端な場合も含めて考えなければならない。また、成功/失敗を検討してはいるが、ビー玉を取り出す毎に壺の中に残されたビー玉の個数は次々に変化し、各試行での成功確率は同じではないため、この問題は[[二項分布]]では正確にモデル化できない。 四分割表に対する[[独立性の検定]]との対比を取るために、この問題を四分割表で表現することを考える。N,m,nが固定されれば周辺度数(marginal frequency:第3列および第3行の値)は全て固定され、下表のようになる。さらに、O11を確定すれば、残りのO12,O21,O12は確定する。今、ここで、さらに、O11=X=kとすると、下表のように、四分割表の値が全て確定する。 {| class="wikitable" style="text-align:center" ! || '''緑玉(成功)''' || '''赤玉(失敗)''' ||'''Row Total ''' |- | align="right" |壺から取り出された|| O11=''k'' || O12=''n'' − ''k'' ||''n'' |- | align="right" | 壺に残った || O21=''K'' − ''k'' || O22=''N + k − n − K'' ||''N − n'' |- | align="right" | ''' Column Total'''|| ''K'' || ''N − K'' || ''N'' |- |} 例えば、上記の問題において、N=50, K=5、n=10の場合を考える。即ち、壺の中には、元々5個の緑玉と45個の赤玉が入っていたものとする。この壺から(目をつぶって)10個のビー玉を非復元的に取り出すことを考える。 このとき、例えば, k=4であれば、四分割表とP(X=4)は以下のようになる。 :<math> P(X=4) = f(4;50,5,10) = {{{5 \choose 4} {{45} \choose {6}}}\over {50 \choose 10}} = {5\cdot 8145060\over 10272278170} = 0.003964583\dots. </math> {| class="wikitable" style="text-align:center" ! || '''緑玉(成功)''' || '''赤玉(失敗)''' || '''Row Total ''' |- | align="right" | 壺から取り出された|| 4 || 6 || 10 |- | align="right" | 壺に残った || 1|| 39|| 40 |- | align="right" | ''' Column Total'''|| 5||45 || 50 |} さらに、k=5の場合を考える。P(X=5)は以下のようになる。 :<math> P(X=5) = f(5;50,5,10) = {{{5 \choose 5} {{45} \choose {5}}}\over {50 \choose 10}} = {1\cdot 1221759 \over 10272278170} = 0.0001189375\dots, </math> これらを比較すると、緑玉が5個の取り出される確率は、4個取り出される確率より約35倍低くなることが判る。 == 多変量超幾何分布 == === 定義 === 属性が {{math2|1 ≤ ''i'' ≤ ''c''}} である要素を {{mvar|K{{sub|i}}}} 個含む {{math2|''N'' {{=}} ''K''{{sub|1}} + … + ''K{{sub|c}}''}} 個の要素よりなる[[母集団]]から {{mvar|n}} 個の要素を非復元抽出したとき、属性が {{mvar|i}} である要素を {{mvar|k{{sub|i}}}} 個含んでいる確率を与える[[確率分布|分布]]を'''多変量超幾何分布'''という。超幾何分布と多変量超幾何分布の関係は、[[二項分布]]と[[多項分布]]の関係に相当する。 === 性質 === 多変量超幾何分布に従う確率変数を {{math2|(''X''{{sub|1}}, …, ''X{{sub|c}}'')}} とする。 * 確率質量関数 <math>\operatorname{P} (X_1 =k_1 ,\dots ,X_c =k_c )=\frac{1}{\binom{N}{n}} \prod_{i=1}^c \binom{K_i}{k_i}</math> * 期待値 <math>E[X_i ]=\frac{nK_i}{N}</math> * 分散 <math>\operatorname{Var} [X_i ]=\frac{(N-n)n(N-K_i )K_i}{(N-1)N^2}</math> * 共分散 <math>\operatorname{Cov} [X_i ,X_j ]=-\frac{(N-n)nK_i K_j}{(N-1)N^2}</math> === 例 === 壺の中に黒い玉が5個、白い玉が10個、赤い玉が15個あるとする。その中から6個の玉を取り出すとき、各色2個ずつ取り出す確率は次の式で計算できる。 :<math>\frac{\binom{5}{2} \binom{10}{2} \binom{15}{2}}{\binom{30}{6}} \approx 0.0796</math> == 幾何分布との関係 == 超幾何分布と[[幾何分布]]は名前の上で類似しているが、分布としては全くの別物だと考えてよい。それぞれの名前は確率関数から生まれる[[列 (数学)|列]]が[[一般化された超幾何関数|超幾何数列]]、[[幾何数列]]であることに由来する。 == 脚注 == {{脚注ヘルプ}} === 注釈 === {{Notelist2}} == 参考文献 == * 蓑谷千凰彦、統計分布ハンドブック、朝倉書店 (2003). * B. S. Everitt(清水良一訳)、統計科学辞典, 朝倉書店 (2002). * M. Galassi et al.(富永大介訳)、GNU Scientific Library リファレンスマニュアル ver. 1.8, p. 199 (2006). == 関連項目 == * [[二項分布]] * [[フィッシャーの正確確率検定]] == 外部リンク == * [http://www.adsciengineering.com/hpdcalc/ Hypergeometric Probability Distribution Calculator (ALPHA)](超幾何分布の計算ができるウェブ・アプリケーション、英語) * [http://www.cbrc.jp/~tominaga/tips/hypergeometric.html ちっぷす:超幾何分布を perl で計算]{{ja icon}} * [http://www.nerdbucket.com/statistics/hypergeometric/ Hypergeometric Probability Calculator: When Good Statistics Go Bad](ウェブ・アプリケーション、[[C++]] および [[Ruby]] のソースコード、英語) * [http://www.okcalculator.com/present-value-calculator/ Present Value Calculator] Calculate the present value of future value sums. * [http://www.cbrc.jp/%7Etominaga/translations/gsl/ GSL reference manual Japanese version] ([[GNU Scientific Library]] のマニュアルの超幾何分布を計算する関数のページ {{確率分布の一覧}} {{DEFAULTSORT:ちようきかふんふ}} [[Category:確率分布|ちようきか]] [[Category:数学に関する記事]]
このページで使用されているテンプレート:
テンプレート:Ja icon
(
ソースを閲覧
)
テンプレート:Lang-en-short
(
ソースを閲覧
)
テンプレート:Math
(
ソースを閲覧
)
テンプレート:Math2
(
ソースを閲覧
)
テンプレート:Mvar
(
ソースを閲覧
)
テンプレート:Notelist2
(
ソースを閲覧
)
テンプレート:See also
(
ソースを閲覧
)
テンプレート:確率分布
(
ソースを閲覧
)
テンプレート:確率分布の一覧
(
ソースを閲覧
)
テンプレート:脚注ヘルプ
(
ソースを閲覧
)
超幾何分布
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報