DFFITS

テンプレート:出典の明記 DFFITS は統計学の回帰分析において、ある点の影響度を示す統計量である。1980年に出版されたベルスレー、クー、ウェルシュ共著の『回帰診断：影響の強いデータと共線形性の源泉を同定する』^[1]で提案された。

DFFITS は問題の点を回帰から外した場合の予測（回帰）値の変化 "DFFIT" を問題の点での当てはめの標準偏差の推定値で割って（スチューデント化、'S'）したものである。

DFFITS = \frac{\hat{y_{i}} - \hat{y_{i (i)}}}{s_{(i)} \sqrt{h_{i i}}} .

ここで $\hat{y_{i}}$ と $\hat{y_{i (i)}}$ は点 i が回帰に含まれた場合と除かれた場合の予測値である。 $s_{(i)}$ は問題の点を含まずに推定された標準誤差の値である。 $h_{i i}$ はその点のてこ値である。

DFFITS は外部スチューデント化残差に似ている。実はそれを $\sqrt{h_{i i} / (1 - h_{i i})}$ 　倍したものである^[2]。誤差が正規分布するとき、外部スチューデント化残差はスチューデントのt分布（自由度は（残差の自由度−1））する。ある点での DFFITS とその点でのテコ因子 $\sqrt{h_{i i} / (1 - h_{i i})}$ との積は同じt分布をする。したがって、テコ値の小さい点では DFFITS は小さいことが期待され、テコ値が 1 に近づくと DFFITS 値の分布は無限に広がる。

完全に均衡のとれた実験計画、たとえば（テンプレート:Ill2や均衡部分因子計画）の場合、各点でのテコ値は $p / n$ 、すなわち母数の個数を点の個数で割ったものである。これは DFFITS 値が（正規分布の場合） $\sqrt{\frac{p}{n - p}} \approx \sqrt{\frac{p}{n}}$ と t 変数の積である。したがって、同書の著者は DFFITS が $2 \sqrt{\frac{p}{n}}$ より大きい場合を外れ点としてチェックすることを薦めている。

類似の量にテンプレート:Ill2がある。

文献

テンプレート:Reflist

テンプレート:Statistics-stub

[1] テンプレート:Cite book

[2] テンプレート:Cite book

[1]

[2]

DFFITS

文献

ナビゲーション メニュー

検索

ナビゲーションメニュー