カイ二乗検定のソースを表示
←
カイ二乗検定
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
'''カイ二乗検定'''(カイにじょうけんてい、カイじじょうけんてい、{{lang-en-short|Chi-squared test}})、または'''<math>\chi ^2</math>検定'''とは、[[帰無仮説]]が正しければ[[検定統計量]]が漸近的に[[カイ二乗分布]]に従うような[[統計学|統計]]的[[仮説検定|検定]]法の総称である。次のようなものを含む。 * '''ピアソンのカイ二乗検定''':カイ二乗検定として最もよく利用されるものである(本項で述べる)。 * 一部の[[尤度比検定]]:[[標本 (統計学)|標本]]サイズが大きい場合には近似的にカイ二乗検定となる場合がある。 * [[イェイツのカイ二乗検定]](イェイツの修正) * [[コクラン・マンテル・ヘンツェルの統計量|マンテル・ヘンツェルのカイ二乗検定]] * [[累積カイ二乗検定]] * [[Linear-by-linear連関カイ二乗検定]] これらはいずれも :<math>\chi^2=\sum\frac{(\mathrm{observed}-\mathrm{expected})^2}{\mathrm{expected}},</math> (ここで"expected" という語は[[期待値]]そのものではなく観測値から求められる期待値の推定量あるいは理論値を指すことが多い) という形の検定統計量「カイ二乗(χ<Sup>2</Sup>)」を含む。 日本工業規格ではカイ二乗検定を「検定統計量が、帰無仮説の下でχ{{sup|2}}分布に従うことを仮定して行う統計的検定」と定義している<ref>[[JIS Z 8101]]-1 : 1999 [[統計]] − [[用語]]と[[記号]] − 第1部:[[確率]]及び一般統計用語 2.60 カイ二乗検定, [[日本規格協会]], http://kikakurui.com/z8/Z8101-1-1999-01.html</ref> 。 ==ピアソンのカイ二乗検定== '''ピアソンのカイ二乗検定'''(Pearson's chi-square test)は、カイ二乗検定のうち最も基本的かつ広く用いられる方法であって、「観察された事象の相対的頻度がある頻度分布に従う」という帰無仮説を検定するものである<ref>[[伏見康治]]「[[確率論及統計論]]」第 VII 章 確率と統計 65節. χ² - 検定法 p.373</ref>。この頻度分布は特定のものに限らない。すなわちこの方法は[[ノンパラメトリック検定]]である。 [[標本空間]]が有限個の[[条件付き確率#排反性|互いに排反]]な[[事象 (確率論)|事象]]の和であるとする(例えば「さいころの目」、「ある人が男か女か」など)。カイ二乗検定統計量とは、各事象に関する頻度の観測値と理論値との差の二乗を理論値で割った商の総和 :<math> \chi^2 = \sum {(O - E)^2 \over E}</math> である。ただしここで''O'' = 頻度の観測値,''E'' = 帰無仮説の下における頻度の期待値(理論値)である。 ピアソンのカイ二乗検定は2つのタイプの比較、'''適合度検定'''及び'''独立性検定'''に用いられる: === 適合度検定 === 観測された[[度数分布]]が理論分布と同じかどうかを検定する。例えば簡単な例として、標本として100人の人がいる場合に、「男と女が'''同数だけいる集団から、ランダムに'''抽出された100人である」という仮説を検定するには、男女の人数の観測度数と期待度数とを比較すればよい。観測値が男45人、女55人ならば、 {| class="wikitable" style="text-align:center; margin:0 auto" |+ <!-- TITLE --> ! ''i'' !! 属性 ''S<sub>i</sub>'' !! 観測度数 ν<sub>''i''</sub> !! 期待確率 ''p<sub>i</sub>'' !! 期待度数 ''np<sub>i</sub>'' !! (ν<sub>''i''</sub> − ''np<sub>i</sub>'')<sup>2</sup>/''np<sub>i</sub>'' |- ! 1 | 男性 || 45 || 1/2 || 50 || 25/50 |- ! 2 | 女性 || 55 || 1/2 || 50 || 25/50 |- ! 計 | || ''n'' = 100 || 1 || 100 || χ<sup>2</sup> = 1 |} :<math> \chi^2 = \sum_i \frac{(\nu_i - np_i)^2}{np_i} = {(45 - 50)^2 \over 50} + {(55 - 50)^2 \over 50} = 1 </math> この場合の[[自由度]]は1である(2つの観測値と理論値の差は、一方を決めると他方も自動的に決まるから)。そこで自由度1のカイ二乗分布を見ると、男女の人数が等しい場合にこのような差(及び女がさらに多くなるような場合)が見出される[[確率]]は、おおよそ0.32である。この確率は普通用いる統計学的有意水準( α = 0.05, 0.01など)よりも高いから、「男女の人数が等しい」とする帰無仮説を棄却する理由がない。 またカイ二乗分布で十分近似できるのは、実際的な問題として期待度数が条件 ''np<sub>i</sub>'' ≥ 10 をすべての属性に対して満たすときとされている{{sfn|Cramér|1999|p={{google books quote|id=CRTKKaJO0DYC|page=420|420}}}}。 === 独立性検定 === 2つの変数に対する2つの観察(2x2[[分割表]]で表される)が互いに[[独立 (確率論)|独立]]かどうかを検定する。例えば、「別の地域の人々について、選挙である候補を支持する頻度が違う」かどうかを検定する方法である。 カイ二乗の計算値は、確率分布が[[二項分布]]あるいは[[正規分布]]に従う集団に関しては正確にカイ二乗分布に従う。 期待値が二項分布: :<math> E =^d \mbox{Bin}(n,p) </math> (ただしここで、''p'' = 帰無仮説の下での確率,''n'' = 標本の観測値) に従う場合、カイ二乗は自由度1のカイ二乗分布に従う。なおこの二項分布はサンプルサイズが大きい場合には次のような[[正規分布]]で近似できる: :<math> \mbox{Bin}(n,p) \approx^d \mbox{N}(np, np(1-p)) </math> 標準正規分布に従う<math>k</math>個の変数<math>Z</math>から、各二乗の合計を求めると、自由度<math>k</math>のカイ二乗分布: :<math> \sum_{i=1}^k Z^2_i =^d \chi^2_k </math> に従う。 しかし一般の頻度分布でもカイ二乗は「近似的には」カイ二乗分布に従うので、カイ二乗検定が適用可能である。期待値Eが小さい(サンプルサイズが小さい、または観測数が少ない)場合は、二項分布を正規分布ではうまく近似できないため、この場合には[[尤度比検定]]の1つである[[G検定]]を用いるのがより適切である。サンプルサイズが小さい場合は、[[二項検定]]、さらに2x2分割表で表される場合には[[フィッシャーの正確確率検定]]を用いる必要がある。 == 脚注 == {{reflist|2}} == 参考文献 == *{{cite book |last1 = Cramér |first1 = Harald |year = 1999 |origyear = 1946 |title = Mathematical Methods of Statistics |series = Princeton Landmarks in Mathematics |url = {{google books|CRTKKaJO0DYC|plainurl=yes}} |publisher = Princeton University Press |isbn = 0-691-00547-8 |mr = 1816288 |zbl = 0985.62001 |ref = harv }} * {{Cite book|和書|author=西岡康夫|year=2013|title=数学チュートリアル やさしく語る 確率統計|publisher=[[オーム社]]|isbn=9784274214073}} * {{Cite book|和書|author=伏見康治|authorlink=伏見康治|year=1942|title=確率論及統計論|publisher=[[河出書房]]|isbn=9784874720127|url= http://ebsa.ism.ac.jp/ebooks/ebook/204}} * {{Cite book|和書|author=日本数学会|authorlink=日本数学会|year=2007|title=数学辞典|publisher=[[岩波書店]]|isbn=9784000803090}} * [[JIS Z 8101]]-1:1999 [[統計]] − [[用語]]と[[記号]] − 第1部:[[確率]]及び一般統計用語, [[日本規格協会]], http://kikakurui.com/z8/Z8101-1-1999-01.html ==関連項目== * [[確率]] ** [[確率論]] * [[統計学]] ** [[推計統計学]] == 外部リンク == * [http://ebsa.ism.ac.jp/ebooks/sites/default/files/ebook/1321/pdf/table4.pdf カイ二乗分布表] — {{cite book | 和書 | author=脇本和昌 | title=身近なデータによる統計解析入門 | url=http://ebsa.ism.ac.jp/ebooks/ebook/1321 | year=1973 | publisher=[[森北出版]] | isbn=4627090307}} 付表 {{統計学}} {{Normdaten}} {{DEFAULTSORT:かいししようけんてい}} [[Category:統計検定]] [[Category:数学に関する記事]]
このページで使用されているテンプレート:
テンプレート:Cite book
(
ソースを閲覧
)
テンプレート:Lang-en-short
(
ソースを閲覧
)
テンプレート:Normdaten
(
ソースを閲覧
)
テンプレート:Reflist
(
ソースを閲覧
)
テンプレート:Sfn
(
ソースを閲覧
)
テンプレート:Sup
(
ソースを閲覧
)
テンプレート:統計学
(
ソースを閲覧
)
カイ二乗検定
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報