尤度方程式
尤度方程式(ゆうどほうていしき、テンプレート:Lang-en-short)とは、統計学において、対数尤度関数の極値条件を与える方程式の事テンプレート:Sfnテンプレート:Sfn。統計的推定法の一つである最尤法において、尤度関数を最大化する最尤推定値を求める際に用いられる。
概要
独立同分布を満たす 個の確率変数 とその観測値 を定義する。すなわち真の分布から 個の観測値(データ)が無作為抽出された状況を考える。
ここで確率密度関数 に従う確率モデルを導入する。ここで は分布パラメータ群であり、パラメータ空間テンプレート:Mathに値を持つ。この確率モデルが を最も良く説明する を求めたい。ゆえに最尤推定をおこなう。
このとき独立同分布条件により、尤度関数 と対数尤度関数 は以下で定義される。
すなわちあるデータ群に対するモデルの尤度関数は、各観測値に対する尤度関数の積(対数尤度の場合は和)となる。
最尤法では対数尤度関数を最大化する が最尤推定値 として定まる。このとき は次の極値条件を満たす。
この方程式を尤度方程式という。左辺の勾配ベクトル:
は、スコア関数、もしくは単にスコアと呼ばれる。多くの場合、最尤推定値の推定は、尤度方程式を解く問題、すなわち、スコアをゼロとするパラメータテンプレート:Mathを求める問題に帰着する。
例
正規分布
テンプレート:Mathが平均をテンプレート:Mvar、分散をテンプレート:Mvarとする正規分布に従うとする(テンプレート:Math)。このとき、対数尤度関数は
であり、尤度方程式は
となる。これらを整理すると最尤推定値として
を得る。
ワイブル分布
テンプレート:Mathが形状パラメータをテンプレート:Mvar、尺度パラメータをテンプレート:Mvarとするワイブル分布に従うとする。このとき、対数尤度関数は
であり、尤度方程式は
となる。 これらを整理すると最尤推定値テンプレート:Math、テンプレート:Mathが満たすべき関係式
を得る。第二式を満たすテンプレート:Mathを数値的に求めれば、第一式よりテンプレート:Mathも定まる。
ガンマ分布
テンプレート:Mathが形状パラメータをテンプレート:Mvar、尺度パラメータをテンプレート:Mvarとするガンマ分布に従うとする(テンプレート:Math)。このとき、対数尤度関数は
であり、尤度方程式は
となる。 ここではテンプレート:Mathはガンマ関数の対数微分であるディガンマ関数を表す。これらを整理すると最尤推定値テンプレート:Math、テンプレート:Mathが満たすべき関係式
を得る。第二式を満たすテンプレート:Mathを数値的に求めれば、第一式よりテンプレート:Mathも定まる。
数値解法
尤度方程式が解析的に解けない場合、テンプレート:Mathを満たすテンプレート:Mathを数値的に求めることが必要となるテンプレート:Sfn。
ニュートン=ラフソン法
ニュートン=ラフソン法では、反復計算により、最適解テンプレート:Mathを求める。反復計算のkステップ目で求まったパラメータをテンプレート:Mathとする。スコア関数はテイラー展開により、
と一次近似できる。ここでテンプレート:Mathは、
で与えられる、対数尤度関数のヘッセ行列の符号を変えた行列である。ニュートン=ラフソン法では、左辺をゼロとおくことで、テンプレート:Mathを与える更新式
を定める。
ニュートン=ラフソン法は、最適解テンプレート:Mathの近傍で二次収束するため、収束が早い。すなわち、テンプレート:Mathの十分近くの適切な初期値を与えれば、
を満たす正の定数テンプレート:Mvarが存在する。
一方で、ニュートン=ラフソン法は各ステップで、対数尤度関数のヘッセ行列から定まるテンプレート:Mathの逆行列を計算する、もしくは、テンプレート:Mvar次の連立方程式を解くことが必要となる。これらの計算量はテンプレート:Mathのオーダーであり、パラメータ数テンプレート:Mvarが増えると、計算負荷が急激に増える。また、初期値の設定によっては、テンプレート:Mathは正定値とはならず、最適解テンプレート:Mathに収束しない場合がある。
フィッシャーのスコア法
ニュートン=ラフソン法においては、各ステップで負の対数尤度関数の二階微分であるテンプレート:Mathを計算する必要がある。このテンプレート:Mathを求める計算は、場合によっては煩雑となる。分布によっては、テンプレート:Mathの期待値であるフィッシャー情報行列
が、より簡潔に求まるため、テンプレート:Mathをテンプレート:Mathで代用し、反復計算を
とする。この方法をフィッシャーのスコア法と呼ぶ。
フィッシャー情報行列は非負定値であるため、ニュートン=ラフソン法でのテンプレート:Mathの正定値性の問題を回避することができる。