混合モデル

提供: testwiki
2024年5月28日 (火) 18:04時点における240d:1a:3ce:c00:4ce7:76b:ec56:fe14 (トーク)による版
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

テンプレート:Distinguish テンプレート:Expand English 混合モデル(こんごうモデル、テンプレート:Lang-en-short)とは、固定効果(fixed effect)と変量効果(random effect)を共に含む(ゆえに混合効果と呼ばれる)統計学的モデルであり、医学・生物学・社会科学等の広い領域に用いられる。特に縦断研究においてある項目を繰り返し観察するテンプレート:仮リンク等で有用である。欠測データの取り扱いに優れ、混合効果モデルは多くの場合、反復測定分散分析等の伝統的なアプローチよりも望ましい。

歴史と現状

1918年、ロナルド・フィッシャーが関連する項目間の特性を変量効果モデルとして導き出した事に由来する[1]。1950年代、チャールズ・ヘンダーソンが固定効果モデルである最良線形不偏推定量(BLUE)および変量効果モデルであるテンプレート:仮リンク(BLUP)を規定した[2][3][4][5]

その後、混合モデルは最尤推定量、非線形混合効果モデル、欠測のあるモデル、混合効果モデルのベイズ推定量の計算等に用いられるようになった。混合モデルは各測定点での値が相互に影響し合うケースに用いられ、現在ではヒトに対する臨床試験や動物実験で汎用されているほか、テンプレート:要出典範囲

定義

行列を用いて以下の様に記述する。

𝒚=Xβ+Z𝒖+ϵ

ここで、

  • 𝒚 は既知の測定値ベクトルであり、その平均は E(𝒚)=Xβ である。
  • β は固定効果の未知ベクトルである。
  • 𝒖 は変量効果の未知ベクトルであり、その平均は E(𝒖)=0 で、分散共分散行列は var(𝒖)=G である。
  • ϵ測定誤差の未知ベクトルであり、その平均は E(ϵ)=0 で、分散は var(ϵ)=R である。
  • X ならびに Z は各々、𝒚 から β ならびに 𝒖 の測定値に関する既知の計画行列である。

推定

𝒚𝒖 の結合密度関数は次の様に書ける: f(𝒚,𝒖)=f(𝒚|𝒖)f(𝒖)

𝒖𝒩(0,G)ϵ𝒩(0,R) および Cov(𝒖,ϵ)=0 には正規分布を仮定し、β𝒖同時密度関数(結合密度関数とも)を最大化すると、ヘンダーソンの“mixed model equations (MME)”が得られる[6][2][4]

(XR1XXR1ZZR1XZR1Z+G1)(β^𝒖^)=(XR1𝒚ZR1𝒚)

このMMEを解く時、 β^𝒖^ はそれぞれ、β𝒖 の最良線形不偏推定量(BLUE)と最良線形不偏予測量(BLUP)である。これは、目的変数の条件付き分散が単位行列のスカラー倍にならない場合のガウス=マルコフの定理の解である。条件付き分散が既知である時、逆分散の加重最小二乗推定値はBLUEであるが、条件付き分散が既知であることは稀である。従ってMMEを解く時は、分散と加重推定値を同時推定する必要がある。

この様な混合モデルに適用する方法の一つとして、EMアルゴリズム[7]がある。EMアルゴリズムにおいては分散成分が結合尤度における未観測のテンプレート:仮リンクとして扱われる。現在は、R言語(「nlme」ライブラリの「lme」関数)やテンプレート:仮リンク(「proc mixed」プロシジャ)に実装されている。混合モデル式の解法として、誤差が正規分布する場合は最尤推定法を用いる[8][9]

出典

テンプレート:Reflist

参考文献

  • Milliken, G. A., & Johnson, D. E. (1992). Analysis of messy data: Vol. I. Designed experiments. New York: Chapman & Hall.
  • West, B. T., Welch, K. B., & Galecki, A. T. (2007). Linear mixed models: A practical guide to using statistical software. New York: Chapman & Hall/CRC.

関連項目

テンプレート:統計学