ミルズ比

提供: testwiki
ナビゲーションに移動 検索に移動

確率論において、 連続確率分布 Xミルズ比(ミル比)は、関数

m(x):=F¯(x)f(x),

で表される。このとき、 f(x) はXの確率密度変数であり、

F¯(x):=Pr[X>x]=x+f(u)du

生存関数(相補累積分布関数)である。 この概念は John P. Millsにちなんで名づけられている[1]

ミルズ比はハザード率 h(x)に関連し、

h(x):=limδ01δPr[x<Xx+δ|X>x]

のときのミルズ比は

m(x)=1h(x).

となる。

X標準正規分布であるとき、 ミルズ比は次のように表される。

m(x)1/x,

このとき、記号 は2つの関数の商が x+のときに1に収束することを示している(詳細はen:Q-functionを参照)。より正確な漸近線を与えることができる。

逆ミルズ比

逆ミルズ比 は、ある分布の 相補累積分布関数確率密度関数 である。逆ミルズ比は、下記のようなデータが切断された正規分布に用いられる。 X が平均値 μ 分散 σ2正規分布確率変数 のとき、

E[X| X>α]=μ+σϕ(αμσ)1Φ(αμσ),E[X| X<α]=μσϕ(αμσ)Φ(αμσ),

このとき、 α は母数, ϕ 標準正規分布の確率密度関数、Φ 標準正規分布の累積分布関数を示す。この二つの要素が、逆ミルズ比である[2]

回帰分析での使用

一般的な逆ミルズ比の適用例は、回帰分析でのセレクションバイアスの影響を補正する際に用いる。従属変数が打ち切られている(すなわちすべての変数が観測されたものではない)とき、ゼロとして観測された変数が多く存在する。この問題は、Tobin (1958)によって初めて指摘された。彼は、回帰分析での推定の際に打ち切りの影響を考慮しない場合、通常の最小二乗法による推定では偏ったパラメータ推定値が得られることを指摘している[3]。これは、打ち切られた従属変数を用いることで、独立変数と誤差項の間の相関がゼロであるというガウス=マルコフの定理の仮定に反することからわかる[4]

James Heckman はセレクションバイアスを補正するために、逆ミルズ比を用いた2段階推定法を提案した[5][6]。第一に、従属変数をプロビットモデルを用いた回帰分析を行う。逆ミルズ比は、ロジットモデルでは用いることができず、プロビットモデルから推定する必要がある。このプロビットモデルは、誤差項が標準正規分布に従うと仮定している[5]。第二に、プロビットモデルを用いて推定されたパラメータを用いて逆ミルズ比を計算し、この結果を最小二乗法を用いた回帰分析の説明変数に用いる[7]

関連項目

参考文献

テンプレート:Reflist