中心極限定理

提供: testwiki
ナビゲーションに移動 検索に移動

テンプレート:告知 テンプレート:出典の明記

サイコロを テンプレート:Mvar 回振ったときの出た目の和 テンプレート:Math2 の分布が テンプレート:Mvar を大きくするに従って正規分布による近似に近づく様子

中心極限定理(ちゅうしんきょくげんていり、テンプレート:Lang-en-short)は、確率論統計学における極限定理の一つ。

大数の法則によると、ある母集団から無作為抽出した標本の算術平均は、標本の大きさを大きくすると母集団の母平均に近づく。これに対して中心極限定理は、標本の算術平均と母平均との誤差確率分布が、定理の条件が満たされれば、標本の大きさを大きくすると近似的に期待値ゼロの「正規分布」になることをいう。

なお、母集団の分散が存在しないあるいは有限実数にならないときには、標本平均と母平均の誤差の分布の極限が正規分布と異なる場合もある。

中心極限定理は、統計学における基本定理であり、例えば世論調査における必要サンプルのサイズの算出等に用いられる。

定理

以下の定理はLindeberg (1922) による[1]

期待値 テンプレート:Mvar と分散 テンプレート:Math を持つ独立同分布 ("i.i.d.") に従う確率変数テンプレート:Math2 に対し Sn:=k=1nXk とおくと、

P(Snnμnσα)12παex2/2dx(n).

つまり、独立同分布に従う確率変数列の部分和を標準化すると、期待値 テンプレート:Math, 分散 テンプレート:Math正規分布 テンプレート:Math分布収束する。

これにより(正規分布に従う確率変数の一次式もまた正規分布に従うため)テンプレート:Mvar が十分大きいとき近似的に、部分和 テンプレート:Math2 は平均 テンプレート:Mvar, 分散 テンプレート:Math の正規分布 テンプレート:Math に従い、標本平均 X¯n=(X1++Xn)/n は平均 テンプレート:Mvar, 分散 テンプレート:Math の正規分布 テンプレート:Math に従う。

証明

中心極限定理は、特性関数(とレヴィの連続性定理)を用いることにより証明できる。

テンプレート:Math独立同分布に従う確率変数とする。分布の平均を テンプレート:Mvar、分散を テンプレート:Math とする。ここで部分和 テンプレート:Math を考えると、その平均と分散はそれぞれ テンプレート:Mvar, テンプレート:Math となる。 Sn標準化した確率変数を Zn とおくと、

Zn=Snnμnσ2=j=1nXjμnσ2=1nj=1nYj

を得る。最後の式では新たに、Xj標準化した確率変数 テンプレート:Math を導入した。ここで、テンプレート:Mvar特性関数は、独立性より積の期待値は期待値の積になるため、

φZn(t)=E[exp(itZn)]=E[j=1nexp(itYjn)]=j=1nE[exp(itYjn)]=(φY1(tn))n

最後の等式は全ての テンプレート:Mvar は同一分布に従うため同じ特性関数を持つことから導いた。ここで、φY1(t)マクローリン展開する。

φY1(0)=E[eitY1]|t=0=1φY1(0)=E[iY1eitY1]|t=0=E[iY1]=iE[Y1]=0φY1(0)=E[Y12eitY1]|t=0=E[Y12]=V[Y1]=1

より

φY1(tn)=1t22n+O(n32),n

となる。ここで、テンプレート:Mathランダウの記号である。この式と指数関数の定義

ex=limn(1+xn)n

を用いると、φZn(t)n における極限が以下のように求められる。

φZn(t)=(φY1(tn))n=(1t22n+O(n32))n=(1+t22+O(n12)n)net2/2,n

最後の関数は標準正規分布 テンプレート:Math の特性関数である。特性関数確率分布の対応は一対一なので、この結果は、テンプレート:Mvar の確率分布が n の極限で標準正規分布 テンプレート:Math に収束することを意味するテンプレート:Efn

以上により、部分和 テンプレート:Math は正規分布 テンプレート:Math に収束し、標本平均 X¯n=(X1++Xn)/n は正規分布 テンプレート:Math に収束することが証明された。

正規分布に収束しない場合

より一般化された確率理論(確率の公理)では、中心極限定理は弱収束理論 (weak-convergence theories) の一部となる。それによると、独立同分布 (i.i.d.) に従う確率変数の分散(2次のモーメント)が有限な場合は「確率変数の和の確率分布」は変数の数が多くなるに従い正規分布に収束するテンプレート:Efnが、確率変数が従う分布の裾が テンプレート:Math(ただし テンプレート:Math2)のべき乗で減衰する場合(分布の裾が厚くなり分散は無限大に発散して)(正規分布には収束せず)特性指数 テンプレート:Mvar安定分布に収束する[2]

※なお安定分布は特性指数が テンプレート:Math2 のとき分散は無限大となり、分布の裾が冪乗則に従うファットテールを有する。

脚注

テンプレート:脚注ヘルプ

注釈

テンプレート:Notelist

出典

テンプレート:Reflist

参考文献

関連項目

テンプレート:Commonscat

テンプレート:確率論 テンプレート:Normdaten