カイ二乗分布
テンプレート:確率分布 カイ二乗分布(カイにじょうぶんぷ、カイじじょうぶんぷ)、またはχテンプレート:Sup分布は確率分布の一種で、推計統計学で最も広く利用されるものである。ヘルメルトにより発見され[1]、ピアソンにより命名された[2]。
独立に標準正規分布に従う テンプレート:Mvar 個の確率変数 テンプレート:Math2 をとる。このとき、統計量
の従う分布のことを自由度 テンプレート:Mvar のカイ二乗分布と呼ぶ。
普通はこれを
と書く。カイ二乗分布は テンプレート:Mvar という1個の母数をもつ。これは テンプレート:Mvar の自由度に等しい正の整数である(場合によっては非整数自由度のカイ二乗分布も用いられる)。カイ二乗分布はガンマ分布の特殊な場合に当たる。
カイ二乗分布はカイ二乗検定と総称される多くの検定法のほか、テンプレート:Illなどにも利用される。
性質
カイ二乗分布の確率密度関数は テンプレート:Math2 に対し
また テンプレート:Math2 に対し テンプレート:Math2 という形をとる。ここで テンプレート:Mvar はガンマ関数である。
分布関数は
(ただし テンプレート:Math は不完全ガンマ関数)である。
(ただし と はカイ二乗分布に従う独立な確率変数)とすると、、つまり自由度で割って比をとるとF分布に従う。
(自由度2)ならば、テンプレート:Mvar は期待値 テンプレート:Math の指数分布に従う。
自由度 テンプレート:Mvar のカイ二乗分布に従う確率変数の期待値は テンプレート:Mvar で、分散は テンプレート:Math である。中央値は近似的に
となる。
カイ二乗分布は再生性を持つ。すなわち、 ならば、 となる。
正規分布による近似
として、テンプレート:Mvar が無限大に近づくと テンプレート:Mvar の分布は正規分布に近づくが、近づき方はゆっくりしている(歪度 、尖度 テンプレート:Math)ため、テンプレート:Mvar 自体より速く正規分布に近づく次の2つの方法が普通用いられる。
- は近似的に平均 テンプレート:Math、分散 テンプレート:Math の正規分布に従う(ロナルド・フィッシャー)。
- は近似的に平均 テンプレート:Math、分散 テンプレート:Math の正規分布に従う(ウィルソンとヒルファティ、1931年)。
出典
関連項目
- ↑ Helmert, F. R. (1875): Ueber die Berechnung des wahrscheinlichen Fehlers aus einer endlichen Anzahl wahrer Beobachtungsfehler, Zeitschrift für Mathematik und Physik, 20, 300-303, テンプレート:Internet Archive.
- ↑ Pearson, K. (1900): On the Criterion that a Given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it Can Reasonably Be Supposed to have Arisen from Random Sampling, Philosophical Magazine 5, 50, 157-175, テンプレート:Doi.