分散共分散行列

分散共分散行列（ぶんさんきょうぶんさんぎょうれつ、テンプレート:Lang-en-short）や共分散行列（きょうぶんさんぎょうれつ、テンプレート:Lang-en-short）とは、統計学と確率論において、ベクトルの要素間の共分散の行列である。これは、スカラー値をとる確率変数における分散の概念を、多次元に拡張したものである。

定義

次のような列ベクトルを考える。

𝐗 = [\begin{matrix} X_{1} \\ X_{2} \\ ⋮ \\ X_{n} \end{matrix}]

このベクトルの要素が各々分散が有限である確率変数であるとき、( i, j ) の要素が次のような行列 Σ を分散共分散行列という。

Σ_{i j} = E [\begin{matrix} (X_{i} - μ_{i}) (X_{j} - μ_{j}) \end{matrix}] = E (X_{i} X_{j}) - E (X_{i}) E (X_{j})

ただし、

μ_{i} = E (X_{i})

は、ベクトル X の i 番目の要素の期待値である。すなわち、Σ は次のような行列である。

Σ = [\begin{matrix} E [(X_{1} - μ_{1}) (X_{1} - μ_{1})] & E [(X_{1} - μ_{1}) (X_{2} - μ_{2})] & \dots & E [(X_{1} - μ_{1}) (X_{n} - μ_{n})] \\ E [(X_{2} - μ_{2}) (X_{1} - μ_{1})] & E [(X_{2} - μ_{2}) (X_{2} - μ_{2})] & \dots & E [(X_{2} - μ_{2}) (X_{n} - μ_{n})] \\ ⋮ & ⋮ & ⋱ & ⋮ \\ E [(X_{n} - μ_{n}) (X_{1} - μ_{1})] & E [(X_{n} - μ_{n}) (X_{2} - μ_{2})] & \dots & E [(X_{n} - μ_{n}) (X_{n} - μ_{n})] \end{matrix}]

この行列の逆行列は $Σ^{- 1}$ は、逆共分散行列（テンプレート:Lang-en-short）または精度行列（テンプレート:Lang-en-short）と呼ばれる^[1]。

分散の一般化としてみたとき

上記の定義は、下記の等式と同値である。

Σ = E [(𝐗 - E [𝐗]) {(𝐗 - E [𝐗])}^{⊤}]

この形は、スカラー値における分散を高次元に拡張したものと捉えられる。スカラー値を取る確率変数 X について、次が成り立つことに注意する。

σ^{2} = v a r (X) = E [(X - μ)^{2}]

ただし、

μ = E (X)

$Σ$ が、分散共分散行列と呼ばれるのは、対角要素は分散だからである。

名称の問題

この行列の名前の呼び名には、いくつかの異なった流儀がある。統計学者の一部は、テンプレート:日本語版にない記事リンクにならって、この行列が 1 次元の分散の自然な拡張であることから、この行列を確率変数のベクトル $X$ の分散と呼ぶ。また、この行列がベクトル $X$ のスカラー要素の共分散であることから、この行列を共分散行列と呼ぶ流儀もある。すなわち、

var (𝐗) = cov (𝐗) = E [(𝐗 - E [𝐗]) (𝐗 - E [𝐗])^{⊤}]

しかし、二つの確率変数ベクトルの間の相互共分散の標準的な記法は次のようになる。

cov (𝐗, 𝐘) = E [(𝐗 - E [𝐗]) (𝐘 - E [𝐘])^{⊤}]

$var$ による記法は、フェラーの 2 巻の本 An Introduction to Probability Theory and Its Applications^[2]に見ることができるが、どちらの形式もかなり標準化されていて、その間に曖昧性はない。

性質

分散共分散行列 $Σ = E [(𝐗 - E [𝐗]) {(𝐗 - E [𝐗])}^{⊤}]$ について、次のような基本的な性質がある。ただし、 $μ = E (𝐗)$ とし、 $𝐗$ 、 $𝐗_{1}$ と $𝐗_{2}$ は確率変数の $p \times 1$ ベクトル、 $𝐘$ は $q \times 1$ ベクトル、 $𝐚$ は $q \times 1$ ベクトル、 $𝐀$ と $𝐁$ は $q \times p$ 行列とする。

$Σ = E (𝐗 𝐗^{⊤}) - 𝝁 𝝁^{⊤}$
$Σ$ は、半正定値行列
$var (𝐀 𝐗 + 𝐚) = 𝐀 var (𝐗) 𝐀^{⊤}$
$cov (𝐗, 𝐘) = cov (𝐘, 𝐗)^{⊤}$
$cov (𝐗_{1} + 𝐗_{2}, 𝐘) = cov (𝐗_{1}, 𝐘) + cov (𝐗_{2}, 𝐘)$
もし p = q ならば、 $var (𝐗 + 𝐘) = var (𝐗) + cov (𝐗, 𝐘) + cov (𝐘, 𝐗) + var (𝐘)$
$cov (𝐀 𝐗, 𝐁^{⊤} 𝐘) = 𝐀 cov (𝐗, 𝐘) 𝐁$
もし $𝐗$ と $𝐘$ が独立ならば、 $cov (𝐗, 𝐘) = 0$

この共分散行列は、シンプルではあるが、非常に多岐にわたる分野でとても有用なツールである。分散共分散行列からは、データの相関を完全に失わせるような写像を作る変換行列を作ることができる。これは、違った見方をすれば、データを簡便に記述するのに最適な基底を取っていることになる。(分散共分散行列のその他の性質やその証明については、en:Rayleigh quotientを参照) これは、統計学では主成分分析 (PCA) と呼ばれており、画像処理の分野では、テンプレート:仮リンク (KL-transform) と呼ばれている。

線形作用素として

線形作用素としてみたとき、分散共分散行列は、ベクトル c を、確率変数ベクトル X の c に関する c による線形和と確率変数 X 自身の間で取った共分散ベクトルに写像する

𝐜^{⊤} Σ = cov (𝐜^{⊤} 𝐗, 𝐗)

二次形式としてみた場合は、X に関する c と d の二つの線形和の間で取った共分散に写像すると考えればよい。

𝐝^{⊤} Σ 𝐜 = cov (𝐝^{⊤} 𝐗, 𝐜^{⊤} 𝐗)

ここで、d を c とすれば、X に関する c による線形和の分散となる。

𝐜^{⊤} Σ 𝐜

どのような行列が分散共分散行列となれるか

すぐ上で使った次の等式と、

var (𝐚^{⊤} 𝐗) = 𝐚^{⊤} var (𝐗) 𝐚

実数値を取る確率変数の分散は非負であるということから、すぐに半正定値行列だけが分散共分散行列になることができるということがわかる。さらに、任意の半正定値行列は分散共分散行列とみなすことができる。これを示すには、次のようにする。まず、M を p × p の半正定値対称行列とする。有限次元のスペクトル理論より、M は半正定値対称平方根行列 M^1/2 を持つ。X を任意の p × 1 の確率変数の列ベクトルとし、その分散共分散行列が p × p の恒等行列だとする。すると

var (M^{1 / 2} 𝐗) = M^{1 / 2} (var (𝐗)) M^{1 / 2} = M .

複素数の確率変数ベクトル

複素数のスカラー値を取る期待値μの確率変数の分散は、便宜的に、以下のように共役複素数を用いて定義される。

var (z) = E [(z - μ) (z - μ)^{*}]

ただし、 $z^{*}$ は $z$ の共役複素数。

$Z$ が複素数の確率変数の列ベクトルであるときは、共役転置（転置して共役を取ったもの）を用いることで、次の正方行列を得る。

E [(Z - μ) (Z - μ)^{*}]

ただし、 $Z^{*}$ は共役転置。スカラーの転置をとってもやはりスカラーなので、スカラーの場合の議論は、この形の特殊な場合とみなせる。

推定

多次元正規分布の分散共分散行列の最尤推定量の導出は、驚くほど巧妙である。 en:estimation of covariance matricesを参照。

確率密度関数

$n$ 個の相関のある確率変数の確率密度関数、特に n 次のガウス分布に従う確率変数ベクトルの同時確率については、最尤法を参照。

参考文献

テンプレート:統計学

[1] Wasserman.

[2] Feller Vol.1, Feller Vol.2.

[1]

[2]

分散共分散行列

目次

定義

分散の一般化としてみたとき

名称の問題

性質

線形作用素として

どのような行列が分散共分散行列となれるか

複素数の確率変数ベクトル

推定

確率密度関数

関連項目

出典

参考文献

ナビゲーションメニュー

分散共分散行列

定義

分散の一般化としてみたとき

名称の問題

性質

線形作用素として

どのような行列が分散共分散行列となれるか

複素数の確率変数ベクトル

推定

確率密度関数

関連項目

出典

参考文献

ナビゲーション メニュー

検索

ナビゲーションメニュー