尤度方程式

尤度方程式（ゆうどほうていしき、テンプレート:Lang-en-short）とは、統計学において、対数尤度関数の極値条件を与える方程式の事テンプレート:Sfn テンプレート:Sfn。統計的推定法の一つである最尤法において、尤度関数を最大化する最尤推定値を求める際に用いられる。

概要

独立同分布を満たす $n$ 個の確率変数 $𝑫 = {D_{i} ∣ i \in {1, . ., n}}$ とその観測値 $𝒅 = {d_{i} ∣ i \in {1, . ., n}}$ を定義する。すなわち真の分布から $n$ 個の観測値（データ）が無作為抽出された状況を考える。

ここで確率密度関数 $f (X | θ)$ に従う確率モデルを導入する。ここで $θ = (θ_{1}, . ., θ_{p})$ は分布パラメータ群であり、パラメータ空間テンプレート:Mathに値を持つ。この確率モデルが $𝒅$ を最も良く説明する $θ$ を求めたい。ゆえに最尤推定をおこなう。

このとき独立同分布条件により、尤度関数 $L (θ | 𝒅)$ と対数尤度関数 $l (θ | 𝒅)$ は以下で定義される。

L (θ | 𝒅) = \prod_{i = 1}^{n} f (X = d_{i} | θ)

l (θ | 𝒅) = \ln L (θ | 𝒅) = \sum_{i = 1}^{n} \ln f (X = d_{i} | θ)

すなわちあるデータ群に対するモデルの尤度関数は、各観測値に対する尤度関数の積（対数尤度の場合は和）となる。

最尤法では対数尤度関数を最大化する $θ$ が最尤推定値 $\hat{θ}$ として定まる。このとき $\hat{θ}$ は次の極値条件を満たす。

\frac{\partial}{\partial θ} l (θ | 𝒅) = 𝟎

この方程式を尤度方程式という。左辺の勾配ベクトル：

𝐒 (𝒅, θ) : = \frac{\partial}{\partial θ} l (θ | 𝒅)

は、スコア関数、もしくは単にスコアと呼ばれる。多くの場合、最尤推定値の推定は、尤度方程式を解く問題、すなわち、スコアをゼロとするパラメータテンプレート:Mathを求める問題に帰着する。

例

正規分布

テンプレート:Mathが平均をテンプレート:Mvar、分散をテンプレート:Mvarとする正規分布に従うとする（テンプレート:Math）。このとき、対数尤度関数は

l (μ, σ^{2}, 𝐱) = - \frac{n}{2} \ln 2 π - \frac{n}{2} \ln σ^{2} - \frac{1}{2 σ^{2}} \sum_{i = 1}^{n} (x_{i} - μ)^{2}

であり、尤度方程式は

\frac{\partial l (μ, σ^{2}, 𝐱)}{\partial μ} = \frac{1}{σ^{2}} \sum_{i = 1}^{n} (x_{i} - μ) = 0

\frac{\partial l (μ, σ^{2}, 𝐱)}{\partial σ^{2}} = - \frac{n}{2 σ^{2}} + \frac{1}{2 (σ^{2})^{2}} \sum_{i = 1}^{n} (x_{i} - μ)^{2} = 0

となる。これらを整理すると最尤推定値として

\hat{μ} = \frac{1}{n} \sum_{i = 1}^{n} x_{i}

\hat{σ^{2}} = \frac{1}{n} \sum_{i = 1}^{n} (x_{i} - μ)^{2}

を得る。

ワイブル分布

テンプレート:Mathが形状パラメータをテンプレート:Mvar、尺度パラメータをテンプレート:Mvarとするワイブル分布に従うとする。このとき、対数尤度関数は

l (η, β, 𝐱) = n \ln β - n β \ln η + (β - 1) \sum_{i = 1}^{n} \ln x_{i} - \frac{1}{η^{β}} \sum_{i = 1}^{n} x_{i}^{β}

であり、尤度方程式は

\frac{\partial l (η, β, 𝐱)}{\partial η} = - \frac{n β}{η} - \frac{β}{η^{(β + 1)}} \sum_{i = 1}^{n} x_{i}^{β} = 0

\frac{\partial l (η, β, 𝐱)}{\partial β} = \frac{n}{β} - n \ln η + \sum_{i = 1}^{n} \ln x_{i} + \frac{\ln η}{η^{β}} \sum_{i = 1}^{n} x_{i}^{β} + \frac{1}{η^{β}} \sum_{i = 1}^{n} \ln x_{i} x_{i}^{β} = 0

となる。これらを整理すると最尤推定値テンプレート:Math、テンプレート:Mathが満たすべき関係式

\hat{η} = {(\frac{1}{n} \sum_{i = 1}^{n} x_{i}^{\hat{β}})}^{\frac{1}{\hat{β}}}

\frac{1}{\hat{β}} + \frac{1}{n} \sum_{i = 1}^{n} \ln x_{i} - \frac{\sum_{i = 1}^{n} x_{i}^{\hat{β}} \ln x_{i}}{\sum_{i = 1}^{n} x_{i}^{\hat{β}}} = 0

を得る。第二式を満たすテンプレート:Mathを数値的に求めれば、第一式よりテンプレート:Mathも定まる。

ガンマ分布

テンプレート:Mathが形状パラメータをテンプレート:Mvar、尺度パラメータをテンプレート:Mvarとするガンマ分布に従うとする（テンプレート:Math）。このとき、対数尤度関数は

l (α, β, 𝐱) = - n \ln Γ (α) - n α \ln β + (α - 1) \sum_{i = 1}^{n} \ln x_{i} - \frac{1}{β} \sum_{i = 1}^{n} x_{i}

であり、尤度方程式は

\frac{\partial l (α, β, 𝐱)}{\partial α} = - n ψ (α) - n \ln β + (α - 1) \sum_{i = 1}^{n} \ln x_{i} = 0

\frac{\partial l (α, β, 𝐱)}{\partial β} = - \frac{n α}{β} + \frac{1}{β^{2}} \sum_{i = 1}^{n} x_{i} = 0

となる。ここではテンプレート:Mathはガンマ関数の対数微分であるディガンマ関数を表す。これらを整理すると最尤推定値テンプレート:Math、テンプレート:Mathが満たすべき関係式

\hat{β} = \frac{1}{\hat{α}} \frac{1}{n} \sum_{i = 1}^{n} x_{i}

\hat{α} = \frac{\frac{1}{n} \sum_{i = 1}^{n} x_{i}}{{(\prod_{i = 1}^{n} x_{i})}^{\frac{1}{n}}} \exp (ψ (\hat{α}))

を得る。第二式を満たすテンプレート:Mathを数値的に求めれば、第一式よりテンプレート:Mathも定まる。

数値解法

尤度方程式が解析的に解けない場合、テンプレート:Mathを満たすテンプレート:Mathを数値的に求めることが必要となるテンプレート:Sfn。

ニュートン＝ラフソン法

ニュートン＝ラフソン法では、反復計算により、最適解テンプレート:Mathを求める。反復計算のkステップ目で求まったパラメータをテンプレート:Mathとする。スコア関数はテイラー展開により、

𝐒 (𝐱, θ) ≃ 𝐒 (𝐱, θ^{(k)}) - I (θ^{(k)}) (θ - θ^{(k)})

と一次近似できる。ここでテンプレート:Mathは、

I (θ) = - \frac{\partial^{2}}{\partial θ \partial θ^{T}} \ln L (θ, 𝐱)

で与えられる、対数尤度関数のヘッセ行列の符号を変えた行列である。ニュートン＝ラフソン法では、左辺をゼロとおくことで、テンプレート:Mathを与える更新式

θ^{(k + 1)} = θ^{(k)} + I (θ^{(k)})^{- 1} 𝐒 (𝐱, θ^{(k)})

を定める。

ニュートン＝ラフソン法は、最適解テンプレート:Mathの近傍で二次収束するため、収束が早い。すなわち、テンプレート:Mathの十分近くの適切な初期値を与えれば、

| | θ^{(k)} - θ^{*} | | \leq K | | θ^{(k)} - θ^{*} | |^{2}

を満たす正の定数テンプレート:Mvarが存在する。

一方で、ニュートン＝ラフソン法は各ステップで、対数尤度関数のヘッセ行列から定まるテンプレート:Mathの逆行列を計算する、もしくは、テンプレート:Mvar次の連立方程式を解くことが必要となる。これらの計算量はテンプレート:Mathのオーダーであり、パラメータ数テンプレート:Mvarが増えると、計算負荷が急激に増える。また、初期値の設定によっては、テンプレート:Mathは正定値とはならず、最適解テンプレート:Mathに収束しない場合がある。

フィッシャーのスコア法

ニュートン＝ラフソン法においては、各ステップで負の対数尤度関数の二階微分であるテンプレート:Mathを計算する必要がある。このテンプレート:Mathを求める計算は、場合によっては煩雑となる。分布によっては、テンプレート:Mathの期待値であるフィッシャー情報行列

J (θ) = E_{θ} [- \frac{\partial^{2}}{\partial θ \partial θ^{T}} \ln L (θ, 𝐱)] = E_{θ} [\frac{\partial}{\partial θ} \ln L (θ, 𝐱) \frac{\partial}{\partial θ^{T}} \ln L (θ, 𝐱)]

が、より簡潔に求まるため、テンプレート:Mathをテンプレート:Mathで代用し、反復計算を

θ^{(k + 1)} = θ^{(k)} + J (θ^{(k)})^{- 1} 𝐒 (𝐱, θ^{(k)})

とする。この方法をフィッシャーのスコア法と呼ぶ。

フィッシャー情報行列は非負定値であるため、ニュートン＝ラフソン法でのテンプレート:Mathの正定値性の問題を回避することができる。

脚注

テンプレート:Reflist

尤度方程式

目次

概要

例

正規分布

ワイブル分布

ガンマ分布

数値解法

ニュートン＝ラフソン法

フィッシャーのスコア法

脚注

参考文献

関連項目

ナビゲーションメニュー

尤度方程式

概要

例

正規分布

ワイブル分布

ガンマ分布

数値解法

ニュートン＝ラフソン法

フィッシャーのスコア法

脚注

参考文献

関連項目

ナビゲーション メニュー

検索

ナビゲーションメニュー