分散 (確率論)

統計学および確率論における分散（ぶんさん、テンプレート:Lang-en-short）とは、データ（母集団、標本）、確率変数（確率分布）の標準偏差の自乗のことである。分散も標準偏差と同様に散らばり具合を表しテンプレート:Sfn、標準偏差より分散の方が計算が簡単なため、計算する上で分散を用いることも多い。

分散は具体的には、平均値からの偏差の2乗の平均に等しい。データテンプレート:Math2 の分散テンプレート:Math は

s^{2} = \frac{1}{n} \sum_{i = 1}^{n} (x_{i} - \overline{x})^{2}

ここでテンプレート:Math は平均値を表す。

分散がテンプレート:Math であることは、データの値が全て等しいことと同値である。データの分散は二乗平均から平均の2乗を引いた値に等しくなる。

確率変数テンプレート:Mvar の分散テンプレート:Math テンプレート:Efn2は、テンプレート:Mvar の期待値をテンプレート:Math で表すと

テンプレート:Math2

となるテンプレート:Sfn。確率変数の分散は確率変数の2次の中心化モーメントである。

統計学では、記述統計学においては標本の散らばり具合を表す指標として標本分散（ひょうほんぶんさん、テンプレート:Lang-en-short）を、推計統計学においては不偏分散（ふへんぶんさん、テンプレート:Lang-en-short）・不偏標本分散（ふへんひょうほんぶんさん、テンプレート:Lang-en-short）を用いる。

言葉の由来

英語のテンプレート:Lang（バリアンス）という語はロナルド・フィッシャーが1918年に導入した^[1]。

確率変数の分散

2乗可積分確率変数テンプレート:Mvar の分散は期待値をテンプレート:Math で表すと

V [X] = E [(X - E [X])^{2}]

で定義される。これを展開して整理すると

\begin{matrix} V [X] & = E [(X - E [X])^{2}] \\ = E [X^{2} - 2 X E [X] + (E [X])^{2}] \\ = E [X^{2}] - 2 E [X E [X]] + E [(E [X])^{2}] \\ = E [X^{2}] - 2 E [X] E [X] + (E [X])^{2} (∵ E [X] = C o n s t) \\ = E [X^{2}] - (E [X])^{2} \end{matrix}

とも書ける。また確率変数テンプレート:Mvar の特性関数をテンプレート:Math2 とおくと（テンプレート:Mvar は虚数単位）、これは 2階連続的微分可能で

V [X] = - {φ_{X}}^{″} (0) + ({φ_{X}}^{'} (0))^{2}

と表示することもできる。

チェビシェフの不等式から、任意の正の数テンプレート:Mvar に対して

P (| X - E [X] | > ε) \leq \frac{V [X]}{ε^{2}}

が成り立つ。これは分散が小さくなるほど確率変数が期待値に近い値をとりやすくなることを示す大まかな評価である。

性質

テンプレート:Math2 を確率変数、テンプレート:Math2 を定数とし、共分散をテンプレート:Math で表すと

$V [X] \geq 0$ （非負性）
$V [X + b] = V [X]$ （テンプレート:仮リンクに対する不変性）
$V [a X] = a^{2} V [X]$ （斉次性）
$V [\sum_{i} a_{i} X_{i}] = \sum_{i, j} a_{i} a_{j} Cov [X_{i}, X_{j}]$

を満たす。したがって、特にテンプレート:Math2 が独立ならば、

Cov [X_{i}, X_{j}] = {\begin{matrix} V [X_{i}] & (i = j) \\ 0 & (i \neq j) \end{matrix}

より

V [X_{1} + \dots + X_{n}] = V [X_{1}] + \dots + V [X_{n}]

が成り立つ。

例

確率変数テンプレート:Mvar が一様分布テンプレート:Math に従うとき、テンプレート:Math2
確率変数テンプレート:Mvar が正規分布テンプレート:Math に従うとき、テンプレート:Math2
確率変数テンプレート:Mvar が二項分布テンプレート:Math に従うとき、テンプレート:Math2
確率変数テンプレート:Mvar がポアソン分布テンプレート:Math に従うとき、テンプレート:Math

データの分散

推計統計学では、母集団の分散と標本の分散を区別する必要がある。

母分散

大きさがテンプレート:Mvar である母集団テンプレート:Math2 に対して、平均値をテンプレート:Mvar で表すとき、偏差の自乗の平均値

σ^{2} = \frac{1}{n} \sum_{i = 1}^{n} (x_{i} - μ)^{2}

を母分散（ぼぶんさん、テンプレート:Lang-en-short）と言う^[2]。

標本分散・不偏標本分散

母集団の平均が $μ$ 、分散が $σ^{2}$ のとき、大きさがテンプレート:Mvar である標本テンプレート:Math2 に対して、標本の平均値をテンプレート:Math で表すとき、偏差の自乗の平均値

s^{2} = \frac{1}{n} \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2}

で定義されるテンプレート:Math を標本分散（ひょうほんぶんさん、テンプレート:Lang-en-short）と言う。テンプレート:Mvar は標準偏差と呼ばれる^[2]。

定義より、

s^{2} = \frac{1}{n} \sum_{i = 1}^{n} {x_{i}}^{2} - (\bar{x})^{2} = \overline{x^{2}} - (\bar{x})^{2}

となるから、標本分散は2乗の平均値と平均値の2乗との差に等しい。ただし、この計算では概して二乗平均が巨大になるため、浮動小数点数による近似計算を行う場合には桁落ちが起きる可能性がある。このため、浮動小数点数を扱う場合には定義に従って偏差の二乗和を計算することが一般的である（あるいは一般の総和計算と同じくカハンの加算アルゴリズムやテンプレート:仮リンクのような手法により、誤差を小さくする工夫がなされることもある）。

一般に、標本分散の期待値は母分散と一致せず、母分散より小さくなる。これは、母分散は「母平均との偏差」で算出されるのに対し、標本分散では「標本平均との偏差」で算出されることに原因がある。実際には、平均と分散を持つ同一分布からの無作為標本に対して、標本分散の期待値テンプレート:Math について、

E [s^{2}] = E [\frac{1}{n} \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2}] = E [\frac{1}{n} \sum_{i = 1}^{n} (x_{i} - μ - (\bar{x} - μ))^{2}]

= \frac{1}{n} E [\sum_{i = 1}^{n} {(x_{i} - μ - \frac{1}{n} \sum_{j = 1}^{n} (x_{j} - μ))}^{2}]

= \frac{1}{n} E [\sum_{i = 1}^{n} {(\frac{n - 1}{n} (x_{i} - μ) - \frac{1}{n} \sum_{j \neq i} (x_{j} - μ))}^{2}]

= \frac{1}{n} \sum_{i = 1}^{n} E [\frac{(n - 1)^{2}}{n^{2}} (x_{i} - μ)^{2} + \frac{1}{n^{2}} \sum_{j \neq i} (x_{j} - μ)^{2}]

+ \frac{1}{n} \sum_{i = 1}^{n} E [- \frac{2 (n - 1)}{n^{2}} (x_{i} - μ) \sum_{j \neq i} (x_{j} - μ) + \frac{1}{n^{2}} \sum_{j \neq i} \sum_{k \neq i, j} (x_{j} - μ) (x_{k} - μ)]

= \frac{1}{n} \sum_{i = 1}^{n} [\frac{(n - 1)^{2}}{n^{2}} E [(x_{i} - μ)^{2}] + \frac{1}{n^{2}} \sum_{j \neq i} E [(x_{j} - μ)^{2}]]

+ \frac{1}{n} \sum_{i = 1}^{n} [- \frac{2 (n - 1)}{n^{2}} E [(x_{i} - μ) \sum_{j \neq i} (x_{j} - μ)] + \frac{1}{n^{2}} \sum_{j \neq i} \sum_{k \neq i, j} E [(x_{j} - μ) (x_{k} - μ)]]

ここで、

E [(x_{i} - μ)^{2}] = E [(x_{j} - μ)^{2}] = σ^{2}

x_{i}

、

x_{j}

、

x_{k}

は独立のため、

E [(x_{i} - μ) \sum_{j \neq i} (x_{j} - μ)] = E [x_{i} - μ] E [\sum_{j \neq i} (x_{j} - μ)] = 0

E [(x_{j} - μ) (x_{k} - μ)] = E [x_{j} - μ] E [x_{k} - μ] = 0

となるため、

E [s^{2}] = \frac{1}{n} \sum_{i = 1}^{n} (\frac{(n - 1)^{2}}{n^{2}} σ^{2} + \frac{n - 1}{n^{2}} σ^{2}) = \frac{n - 1}{n} σ^{2}

が成り立つ。

そこで

{\hat{σ}}^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2} = \frac{n}{n - 1} s^{2}

を用いると、

E [\frac{1}{n - 1} \sum_{1}^{n} (x_{i} - \bar{x})^{2}] = σ^{2}

となり、期待値が母分散に等しくなる推定量が得られる。つまり母分散の不偏推定量となる。これを不偏標本分散（ふへんひょうほんぶんさん、テンプレート:Lang-en-short）や不偏分散（ふへんぶんさん、テンプレート:Lang-en-short）と呼ぶ^[2]。

上記の標本分散は不偏でないことを強調する場合偏りのある標本分散（テンプレート:Lang-en-short）と言う。テンプレート:See also なお、不偏標本分散を単に標本分散と呼ぶ文献もある。

定義から明らかに、標本の大きさが大きくなる程につれて偏りのある標本分散は不偏標本分散に近づく。

分散 (確率論)

目次

言葉の由来

確率変数の分散

性質

例

データの分散

母分散

標本分散・不偏標本分散

注釈

出典

参考文献

関連項目

ナビゲーションメニュー

分散 (確率論)

言葉の由来

確率変数の分散

性質

例

データの分散

母分散

標本分散・不偏標本分散

注釈

出典

参考文献

関連項目

ナビゲーション メニュー

検索

ナビゲーションメニュー