中心極限定理

中心極限定理(ちゅうしんきょくげんていり、テンプレート:Lang-en-short)は、確率論・統計学における極限定理の一つ。
大数の法則によると、ある母集団から無作為抽出した標本の算術平均は、標本の大きさを大きくすると母集団の母平均に近づく。これに対して中心極限定理は、標本の算術平均と母平均との誤差の確率分布が、定理の条件が満たされれば、標本の大きさを大きくすると近似的に期待値ゼロの「正規分布」になることをいう。
なお、母集団の分散が存在しないあるいは有限の実数にならないときには、標本平均と母平均の誤差の分布の極限が正規分布と異なる場合もある。
中心極限定理は、統計学における基本定理であり、例えば世論調査における必要サンプルのサイズの算出等に用いられる。
定理
以下の定理はLindeberg (1922) による[1]。
期待値 テンプレート:Mvar と分散 テンプレート:Math を持つ独立同分布 ("i.i.d.") に従う確率変数列 テンプレート:Math2 に対し とおくと、
つまり、独立同分布に従う確率変数列の部分和を標準化すると、期待値 テンプレート:Math, 分散 テンプレート:Math の正規分布 テンプレート:Math に分布収束する。
これにより(正規分布に従う確率変数の一次式もまた正規分布に従うため)テンプレート:Mvar が十分大きいとき近似的に、部分和 テンプレート:Math2 は平均 テンプレート:Mvar, 分散 テンプレート:Math の正規分布 テンプレート:Math に従い、標本平均 は平均 テンプレート:Mvar, 分散 テンプレート:Math の正規分布 テンプレート:Math に従う。
証明
中心極限定理は、特性関数(とレヴィの連続性定理)を用いることにより証明できる。
テンプレート:Math を独立同分布に従う確率変数とする。分布の平均を テンプレート:Mvar、分散を テンプレート:Math とする。ここで部分和 テンプレート:Math を考えると、その平均と分散はそれぞれ テンプレート:Mvar, テンプレート:Math となる。 を標準化した確率変数を とおくと、
を得る。最後の式では新たに、 を標準化した確率変数 テンプレート:Math を導入した。ここで、テンプレート:Mvar の特性関数は、独立性より積の期待値は期待値の積になるため、
最後の等式は全ての テンプレート:Mvar は同一分布に従うため同じ特性関数を持つことから導いた。ここで、 をマクローリン展開する。
より
となる。ここで、テンプレート:Math はランダウの記号である。この式と指数関数の定義
を用いると、 の における極限が以下のように求められる。
最後の関数は標準正規分布 テンプレート:Math の特性関数である。特性関数と確率分布の対応は一対一なので、この結果は、テンプレート:Mvar の確率分布が の極限で標準正規分布 テンプレート:Math に収束することを意味するテンプレート:Efn。
以上により、部分和 テンプレート:Math は正規分布 テンプレート:Math に収束し、標本平均 は正規分布 テンプレート:Math に収束することが証明された。
正規分布に収束しない場合
より一般化された確率理論(確率の公理)では、中心極限定理は弱収束理論 (weak-convergence theories) の一部となる。それによると、独立同分布 (i.i.d.) に従う確率変数の分散(2次のモーメント)が有限な場合は「確率変数の和の確率分布」は変数の数が多くなるに従い正規分布に収束するテンプレート:Efnが、確率変数が従う分布の裾が テンプレート:Math(ただし テンプレート:Math2)のべき乗で減衰する場合(分布の裾が厚くなり分散は無限大に発散して)(正規分布には収束せず)特性指数 テンプレート:Mvar の安定分布に収束する[2]。
※なお安定分布は特性指数が テンプレート:Math2 のとき分散は無限大となり、分布の裾が冪乗則に従うファットテールを有する。