多変量正規分布

提供: testwiki
ナビゲーションに移動 検索に移動

テンプレート:確率分布 確率論統計学において、多変量正規分布(たへんりょうせいきぶんぷ、テンプレート:Lang-en-short)または多次元正規分布、あるいは結合正規分布テンプレート:Lang-en-short)、もしくはこれらの語で「正規分布」を「ガウス分布」に換えたもの、は1次元の正規分布高次元へと一般化した確率分布である。テンプレート:仮リンクk 変量正規分布に従うとは、それらの k 個の成分(実数値確率変数)の任意の(実係数)線型結合が1変量正規分布に従うことを言う。この分布の重要性は主として、多変数の場合の中心極限定理分布収束先として現れることによる。多変量正規分布はしばしば、少なくとも近似的に、互いに相関を持ち、平均ベクトルの周辺に値が集中するような確率変数の組を記述するのに用いられる。

記法とパラメータ

k 次元ベクトル値確率変数 𝐗=(X1,,Xk) が多変量正規分布に従っていることを、次のように記す:

𝐗  𝒩(μ,Σ)

もしくは Xk 次元であることを明示して

𝐗  𝒩k(μ,Σ)

と書くこともある。

ここで k 次元平均ベクトルは

μ=E[𝐗]=(E[X1],E[X2],,E[Xk]),

であり、k×k 分散共分散行列

Σi,j:=E[(Xiμi)(Xjμj)]=Cov[Xi,Xj]

(ただし 1i,jk)である。分散共分散行列の逆行列は精度行列(precision matrix)と呼ばれ、𝑸=Σ1 と記す。

定義

標準正規確率変数ベクトル

実数値確率変数から成るベクトル 𝐗=(X1,,Xk)T が標準正規確率変数ベクトル(standard normal random vector)であるとは、それらの成分 Xn独立であって、いずれも平均 0、分散 1 の正規分布に従っている(全ての n に対し、Xn 𝒩(0,1))ことを言う[1]テンプレート:Rp

中心化正規確率変数ベクトル

実数値確率変数から成るベクトル 𝐗=(X1,,Xk)T が中心化正規確率変数ベクトル(centered normal random vector)であるとは、 k× 実成分定行列 𝑨 が存在して、𝑨𝐙𝐗 と同一の確率分布に従うことを言う。ここで 𝐙 次元標準正規確率変数ベクトルである[1]テンプレート:Rp

正規確率変数ベクトル

確率変数ベクトル 𝐗=(X1,,Xk)T が正規確率変数ベクトルであるとは、 成分の標準正規確率変数ベクトル 𝐙k 次元平均ベクトル μ、および k× 行列 𝑨 があって、 𝐗=𝑨𝐙+μ と書けることを言う[2]テンプレート:Rp[1]テンプレート:Rp

形式的に表すと:

𝐗  𝒩(μ,Σ)there exist μk,𝑨k× such that 𝐗=𝑨𝐙+μ for Zn 𝒩(0,1),i.i.d.

このとき共分散行列は Σ=𝑨𝑨T となる。

共分散行列が非正則である(退化している)場合、対応する多変量正規分布は(連続であるような)確率密度関数を持たない。このような事態は統計学ではしばしば起こり、例えば、最小二乗法における残差ベクトルがそうした分布に従うことがある。

また、ここでの成分 Xi の集まりは一般的には独立な確率変数ではないことに注意する。これらは独立な正規確率変数の集まり 𝐙 に行列 𝑨 を作用させたものである。

同値な定義

上記の定義で用いた条件は、以下のいずれの条件とも同値である。ベクトル値確率変数 𝐗=(X1,,Xk)T はこれらのいずれかが成り立つとき、多変量正規分布に従うと言う。

  • 任意の線型結合 Y=a1X1++akXk𝐚k を定ベクトルとして Y=𝐚T𝐗)が(1変量)正規分布に従う。ただし分散が 0 の正規分布とは、その平均の位置に確率 1 の確率質量を持つような確率分布を意味することとする。
  • k 成分ベクトル μk×k 対称半正定値行列 Σ が存在して、𝐗特性関数
φ𝐗(𝐮)=exp(i𝐮Tμ12𝐮TΣ𝐮)
と書ける。

球面正規分布(spherical normal distribution)とは、どんな直交座標系で表示しても確率変数ベクトルの各成分が独立となるような分布、と特徴付けられる[3][4]

性質

確率密度関数

2変量正規分布の同時分布

非退化の場合

多変量正規分布が非退化であるとは、共分散行列 Σ が正定値であることである。この場合、分布は次の形の確率密度関数を持つ[5]

f𝐗(x1,,xk)=exp(12(𝐱μ)TΣ1(𝐱μ))(2π)k|Σ|

ここで 𝐱 は実 k 次元列ベクトルで、|Σ|detΣΣ行列式である。Σ1×1 行列(つまり単一の実数)である場合、この式は1変量正規分布の確率密度関数に帰着する。

テンプレート:仮リンクの場合はこれとはわずかに違った形のものになる。

k+1 次元空間内の任意の「等高線」、つまり確率密度関数の値が等しくなるような点の集合は、楕円またはその高次元対応物となる。よって多変量正規分布はテンプレート:仮リンクの特別な場合である。

記述統計量 (𝐱μ)TΣ1(𝐱μ)マハラノビス距離として知られ、試験ベクトル 𝐱 と平均ベクトル μ との一種の距離を表す。k=1 の場合、これは標準得点の絶対値に帰着する。

2変量の場合

2次元で非退化の場合(テンプレート:Nowrap)、ベクトル テンプレート:Nowrap(右肩のダッシュは転置を表す)の確率密度関数は、

f(x,y)=12πσXσY1ρ2exp(12(1ρ2)[(xμX)2σX2+(yμY)2σY22ρ(xμX)(yμY)σXσY])

となる。ここで ρXY相関係数であり、σX>0 かつ σY>0 である。このとき、

μ=(μXμY),Σ=(σX2ρσXσYρσXσYσY2)

2次元のときは、多変量正規分布であるための同値な条件として挙げた最初の方は、やや緩められる:

可算無限通りの X と Y の線型結合がどれも正規分布に従うならば、ベクトル テンプレート:Nowrap は2変量正規分布に従う[6]

2変数の場合の等高線を x,y-平面にプロットすると楕円になる。相関係数 ρ が大きくなっていくとき、楕円は次の直線:

y(x)=sgn(ρ)σYσX(xμX)+μY.

の方向に向かって押しつぶされていく。この背景として、この式の sgn(ρ) ("sgn" は符号関数)を ρ に取り換えたものは、X の値が与えられたときの Yテンプレート:仮リンク(best linear unbiased prediction)になっているという性質がある[7]

結合分布の正規性

正規分布と独立性

確率変数 XY が正規分布に従い、独立であるならば、これらの結合分布は結合正規分布である。つまり、対 (X,Y) は2変量正規分布に従う。しかしながら、多変量正規分布に従う確率変数ベクトルの相異なる2成分は独立であるとは限らない。それらが独立であるのは無相関(ρ=0)の場合に限られる。

正規分布に従う確率変数の対は、必ずしも2変量正規分布には従わない

2個の確率変数 XY がいずれも正規分布に従っているとしても、それらの対 (X,Y) は必ずしも2変量正規分布には従わない。次のように簡単な例(反例)が構成できる。

  • X は標準正規分布(平均 0、分散 1)に従う。
  • ある定数 c>0 があって、|X|>c ならば Y=X|X|<c ならば Y=X

3変数以上の場合も同様に反例が構成できる。一般に、こうした確率変数の和によってテンプレート:仮リンクが作られる。

相関と独立性

一般に、2個の確率変数が無相関であっても独立であるとは限らない。しかし、確率変数ベクトルが多変量正規分布に従っている場合、その2個以上の成分が互いに無相関であれば、それらは独立である。特に、これらがテンプレート:仮リンクであれば、独立である。

しかしながら、すぐ上で指摘した例からわかるように、2個の確率変数が正規分布に従い、かつ無相関であるからといって、それらが独立であるとは限らない(XY の相関係数が 0 となるよう定数 c を選べばよい)。

周辺分布

多変量正規分布に従う確率変数ベクトルから、その中のいくつかの成分を抜き出した確率変数の組が従う周辺分布を得るには、単に平均ベクトル、分散共分散行列から無関係な成分を除けばよい。これが成り立つことは、多変量正規分布の定義と線形代数によって証明できる[8]

テンプレート:Nowrap が多変量正規分布に従うとし、平均ベクトルを テンプレート:Nowrap、分散共分散行列を Σ とする。 このとき テンプレート:Nowrap の周辺分布は再び多変量正規分布であり、その平均ベクトルは テンプレート:Nowrap、分散共分散行列は

Σ=[Σ11Σ13Σ31Σ33]

である。

アフィン変換

𝐗 𝒩(μ,Σ)テンプレート:Nowrap がそのアフィン変換であるとき(cM×1 定ベクトル、BM×N 定行列)、Y も多変量正規分布に従い、平均ベクトルは テンプレート:Nowrap、分散共分散行列は BΣBT である(つまり 𝐘𝒩(𝐜+𝐁μ,𝐁Σ𝐁T))。

特に、成分 Xi たちの任意の部分集合が従う周辺分布は再び多変量正規分布になる。例えば、部分集合 (X1, X2, X4)T を直接抜き出してくるには、行列

𝐁=[100000010000000100]

を使えばよい。

別の系として、多変量正規分布に従う X と定ベクトル bドット積をとった テンプレート:Nowrap は、1変量正規分布に従う(Z𝒩(𝐛μ,𝐛TΣ𝐛))。

𝐁=[b1b2bn]=𝐛T

と考えればよい。Σ の正定値性(半正定値性)から、ドット積をとった確率変数の分散は正(非負)になる。

X のアフィン変換 2X は、X と同一の分布に従う2個の独立な確率変数の和とは別物である。

母数の推定

確率密度関数が

f(𝐱)=1(2π)k|Σ|exp(12(𝐱μ)TΣ1(𝐱μ))

である多変量正規分布に従う大きさ n の標本から、共分散行列を推定することを考える。この場合の最尤推定量

Σ^=1ni=1n(𝐱i𝐱)(𝐱i𝐱)T

であり、これは単純に標本共分散行列を計算したものである。ただし不偏推定量ではなく、期待値は

E[Σ^]=n1nΣ

となる。よって

Σ^=1n1i=1n(𝐱i𝐱)(𝐱i𝐱)T

とすれば不偏推定量になる。多変量正規分布の母数の推定において、フィッシャー情報行列は閉じた式で書け、例えばクラメール・ラオの限界の算出に用いられる。詳細はフィッシャー情報量を参照。

多変量正規分布からのサンプリング

平均ベクトル μ、分散共分散行列 ΣN 次元正規分布に従う乱数ベクトルを生成する方法として、以下に述べるような手法が広く用いられている[9]

  1. テンプレート:Nowrap となるような実行列 A をどれか1つ見つける。Σ が正定値の場合はコレスキー分解が典型的に用いられるが、(平方根演算を避けた)拡張法は Σ が半正定値であれば必ず通用し、いずれの方法でも適当な行列 A が得られる。別の方法として、Σスペクトル分解 Σ = UΛU−1 を用いて A = ½ としてもよい。前者は計算論的に率直な手法だが、分布の基となる確率変数の並べ替え(Σ の行・列交換)によって行列 A は異なったものに変化する。一方後者は、このような変換をしても A の成分が並べ直されるだけである。理論上はどちらの手法を使っても行列が同程度に良く求まるが、計算時間には違いが出る。
  2. テンプレート:Nowrap を、標準正規分布に従う N 個の独立な確率変数から成るベクトルとする(このような乱数は例えばボックス=ミュラー法によって得られる)。
  3. xテンプレート:Nowrap とする。アフィン変換の性質より、このベクトルは所望の分布に従っている。

関連項目

脚注

テンプレート:Reflist

参考文献

テンプレート:Refbegin

テンプレート:Refend

テンプレート:確率分布の一覧

  1. 1.0 1.1 1.2 テンプレート:Cite book
  2. テンプレート:Cite book
  3. テンプレート:Cite journal
  4. テンプレート:Cite journal
  5. UIUC, Lecture 21. The Multivariate Normal Distribution, 21.5:"Finding the Density".
  6. 引用エラー: 無効な <ref> タグです。「HT」という名前の注釈に対するテキストが指定されていません
  7. 引用エラー: 無効な <ref> タグです。「wyattlms」という名前の注釈に対するテキストが指定されていません
  8. 周辺分布についての正式な証明は http://fourier.eng.hmc.edu/e161/lectures/gaussianprocess/node7.html 参照。
  9. 引用エラー: 無効な <ref> タグです。「Gentle」という名前の注釈に対するテキストが指定されていません