尤度方程式

提供: testwiki
ナビゲーションに移動 検索に移動

尤度方程式(ゆうどほうていしき、テンプレート:Lang-en-short)とは、統計学において、対数尤度関数極値条件を与える方程式の事テンプレート:Sfnテンプレート:Sfn統計的推定法の一つである最尤法において、尤度関数を最大化する最尤推定値を求める際に用いられる。

概要

独立同分布を満たす n 個の確率変数 𝑫={Dii{1,..,n}} とその観測値 𝒅={dii{1,..,n}} を定義する。すなわち真の分布から n 個の観測値(データ)が無作為抽出された状況を考える。

ここで確率密度関数 f(X|θ) に従う確率モデルを導入する。ここで θ=(θ1,..,θp) は分布パラメータ群であり、パラメータ空間テンプレート:Mathに値を持つ。この確率モデルが 𝒅 を最も良く説明する θ を求めたい。ゆえに最尤推定をおこなう。

このとき独立同分布条件により、尤度関数 L(θ|𝒅) と対数尤度関数 l(θ|𝒅) は以下で定義される。

L(θ|𝒅)=i=1nf(X=di|θ)
l(θ|𝒅)=lnL(θ|𝒅)=i=1nlnf(X=di|θ)

すなわちあるデータ群に対するモデルの尤度関数は、各観測値に対する尤度関数の積(対数尤度の場合は和)となる。

最尤法では対数尤度関数を最大化する θ が最尤推定値 θ^ として定まる。このとき θ^ は次の極値条件を満たす。

θl(θ|𝒅)=𝟎

この方程式を尤度方程式という。左辺の勾配ベクトル

𝐒(𝒅,θ):=θl(θ|𝒅)

は、スコア関数、もしくは単にスコアと呼ばれる。多くの場合、最尤推定値の推定は、尤度方程式を解く問題、すなわち、スコアをゼロとするパラメータテンプレート:Mathを求める問題に帰着する。

正規分布

テンプレート:Mathが平均をテンプレート:Mvar、分散をテンプレート:Mvarとする正規分布に従うとする(テンプレート:Math)。このとき、対数尤度関数は

l(μ,σ2,𝐱)=n2ln2πn2lnσ212σ2i=1n(xiμ)2

であり、尤度方程式は

l(μ,σ2,𝐱)μ=1σ2i=1n(xiμ)=0
l(μ,σ2,𝐱)σ2=n2σ2+12(σ2)2i=1n(xiμ)2=0

となる。これらを整理すると最尤推定値として

μ^=1ni=1nxi
σ2^=1ni=1n(xiμ)2

を得る。

ワイブル分布

テンプレート:Mathが形状パラメータをテンプレート:Mvar、尺度パラメータをテンプレート:Mvarとするワイブル分布に従うとする。このとき、対数尤度関数は

l(η,β,𝐱)=nlnβnβlnη+(β1)i=1nlnxi1ηβi=1nxiβ

であり、尤度方程式は

l(η,β,𝐱)η=nβηβη(β+1)i=1nxiβ=0
l(η,β,𝐱)β=nβnlnη+i=1nlnxi+lnηηβi=1nxiβ+1ηβi=1nlnxixiβ=0

となる。 これらを整理すると最尤推定値テンプレート:Mathテンプレート:Mathが満たすべき関係式

η^=(1ni=1nxiβ^)1β^
1β^+1ni=1nlnxii=1nxiβ^lnxii=1nxiβ^=0

を得る。第二式を満たすテンプレート:Mathを数値的に求めれば、第一式よりテンプレート:Mathも定まる。

ガンマ分布

テンプレート:Mathが形状パラメータをテンプレート:Mvar、尺度パラメータをテンプレート:Mvarとするガンマ分布に従うとする(テンプレート:Math)。このとき、対数尤度関数は

l(α,β,𝐱)=nlnΓ(α)nαlnβ+(α1)i=1nlnxi1βi=1nxi

であり、尤度方程式は

l(α,β,𝐱)α=nψ(α)nlnβ+(α1)i=1nlnxi=0
l(α,β,𝐱)β=nαβ+1β2i=1nxi=0

となる。 ここではテンプレート:Mathはガンマ関数の対数微分であるディガンマ関数を表す。これらを整理すると最尤推定値テンプレート:Mathテンプレート:Mathが満たすべき関係式

β^=1α^1ni=1nxi
α^=1ni=1nxi(i=1nxi)1nexp(ψ(α^))

を得る。第二式を満たすテンプレート:Mathを数値的に求めれば、第一式よりテンプレート:Mathも定まる。

数値解法

尤度方程式が解析的に解けない場合、テンプレート:Mathを満たすテンプレート:Mathを数値的に求めることが必要となるテンプレート:Sfn

ニュートン=ラフソン法

ニュートン=ラフソン法では、反復計算により、最適解テンプレート:Mathを求める。反復計算のkステップ目で求まったパラメータをテンプレート:Mathとする。スコア関数はテイラー展開により、

𝐒(𝐱,θ)𝐒(𝐱,θ(k))I(θ(k))(θθ(k))

一次近似できる。ここでテンプレート:Mathは、

I(θ)=2θθTlnL(θ,𝐱)

で与えられる、対数尤度関数のヘッセ行列の符号を変えた行列である。ニュートン=ラフソン法では、左辺をゼロとおくことで、テンプレート:Mathを与える更新式

θ(k+1)=θ(k)+I(θ(k))1𝐒(𝐱,θ(k))

を定める。

ニュートン=ラフソン法は、最適解テンプレート:Mathの近傍で二次収束するため、収束が早い。すなわち、テンプレート:Mathの十分近くの適切な初期値を与えれば、

||θ(k)θ||K||θ(k)θ||2

を満たす正の定数テンプレート:Mvarが存在する。

一方で、ニュートン=ラフソン法は各ステップで、対数尤度関数のヘッセ行列から定まるテンプレート:Mathの逆行列を計算する、もしくは、テンプレート:Mvar次の連立方程式を解くことが必要となる。これらの計算量テンプレート:Mathオーダーであり、パラメータ数テンプレート:Mvarが増えると、計算負荷が急激に増える。また、初期値の設定によっては、テンプレート:Math正定値とはならず、最適解テンプレート:Mathに収束しない場合がある。

フィッシャーのスコア法

ニュートン=ラフソン法においては、各ステップで負の対数尤度関数の二階微分であるテンプレート:Mathを計算する必要がある。このテンプレート:Mathを求める計算は、場合によっては煩雑となる。分布によっては、テンプレート:Math期待値であるフィッシャー情報行列

J(θ)=Eθ[2θθTlnL(θ,𝐱)]=Eθ[θlnL(θ,𝐱)θTlnL(θ,𝐱)]

が、より簡潔に求まるため、テンプレート:Mathテンプレート:Mathで代用し、反復計算を

θ(k+1)=θ(k)+J(θ(k))1𝐒(𝐱,θ(k))

とする。この方法をフィッシャーのスコア法と呼ぶ。

フィッシャー情報行列は非負定値であるため、ニュートン=ラフソン法でのテンプレート:Mathの正定値性の問題を回避することができる。

脚注

テンプレート:Reflist

参考文献

関連項目

テンプレート:統計学