一般化線形モデル

提供: testwiki
ナビゲーションに移動 検索に移動

テンプレート:脚注の不足

テンプレート:Otheruses テンプレート:回帰分析 一般化線形モデル (いっぱんかせんけいモデル、テンプレート:Lang-en-short)は、残差を任意の分布とした線形モデル。似たものとして一般線形モデルがあるが、これは残差が多変量正規分布に従うモデル。一般化線形モデルには線形回帰ポアソン回帰ロジスティック回帰などが含まれる。1972年ネルダーウェダーバーンによって提唱された[1]

概要

確率変数 Y指数型分布族である、つまり確率密度関数 f(y) は正準 (canonical) パラメーター θ, 分散 (dispersion) パラメーター ϕ とスカラー関数 a(θ), c(y,θ) を用いて指数型 テンプレート:Indent で表すことができるものとする。

一般化線形モデルでは、指数型分布族の正準パラメーター θ について滑らかであるリンク関数 (link function) と呼ばれる関数 g(θ) が、別の確率変数 𝐗 の実現値 𝐱 を用いて、g(θ)=𝐱Tβ と表せるものとする。

一般化線型モデルは下記の3つの要素から構成される。

1. 指数型分布族の確率分布
2. 線形予測子 (linear predictor) η=𝐱Tβ
3. リンク関数 (link function) g such that g(θ)=η

指数分布族の性質

下記のように尤度関数を定める。 テンプレート:Indent

このとき、下記等式が成立する。 テンプレート:Indent

この等式を用いて計算すると、確率変数 Y平均a(θ)分散ϕa(θ) であることが分かる。

下記の他、多くの確率分布が指数分布族に分類される。

  • 正規分布
  • ベルヌーイ分布
  • ポアソン分布
  • 二項分布
  • ガウス分布

実例

正規分布に従うモデル

既知の値 σ2 を用いて a(θ)=θ2/2, ϕ=σ2, c(y,ϕ)=(y2/σ2+log2πσ2)/2 と表されるとき、f(y;θ)=12πσexp((yθ)22σ2) は平均 θ, 分散 σ2正規分布に相当する。

リンク関数として g(θ)=θ (正準リンク<canonical link>とよぶ) を取るとき、これは、正規線型モデル (通常の線型回帰) に相当する。平均 θ𝐱Tβ で与えられる。

ベルヌーイ分布に従うモデル

p=eθ/(1+eθ) を用いて a(θ)=log(1p), ϕ=1, c=0 と表されるとき、f(y;θ)=py(1p)1y は生起確率 pベルヌーイ分布に相当する。

リンク関数として g(θ)=θ を取るとき、これはロジスティック回帰モデル (logistic regression model) に相当する。Y=1,0 の確率は、それぞれ、 テンプレート:Indent テンプレート:Indent で与えられる。

リンク関数として g(θ)=ψ1(p) (ただし、ψ は標準正規分布の累積分布関数) を取るとき、これはプロビット回帰モデルに相当する。p=ψ(𝐱Tβ)となる。

パラメーターの決定には、ニュートン法を用いた最尤法などがある。

脚注

テンプレート:Reflist

参考文献

関連項目

テンプレート:統計学 テンプレート:Statistics-stub

テンプレート:Normdaten