DFFITS

提供: testwiki
ナビゲーションに移動 検索に移動

テンプレート:出典の明記 DFFITS統計学回帰分析において、ある点の影響度を示す統計量である。1980年に出版されたベルスレー、クー、ウェルシュ共著の『回帰診断:影響の強いデータと共線形性の源泉を同定する』[1]で提案された。

DFFITS は 問題の点を回帰から外した場合の予測(回帰)値の変化 "DFFIT" を問題の点での当てはめの標準偏差の推定値で割って(スチューデント化、'S')したものである。

DFFITS=yi^yi(i)^s(i)hii.

ここで yi^yi(i)^ は点 i が回帰に含まれた場合と除かれた場合の予測値である。s(i) は問題の点を含まずに推定された標準誤差の値である。hii は その点のてこ値 である。

DFFITS は外部スチューデント化残差に似ている。実はそれをhii/(1hii) 倍したものである[2]。誤差が正規分布するとき、外部スチューデント化残差はスチューデントのt分布自由度は(残差の自由度−1))する。ある点での DFFITS とその点でのテコ因子 hii/(1hii) との積は同じt分布をする。したがって、テコ値の小さい点では DFFITS は小さいことが期待され、テコ値が 1 に近づくと DFFITS 値の分布は無限に広がる。

完全に均衡のとれた実験計画、たとえば(テンプレート:Ill2や均衡部分因子計画)の場合、各点でのテコ値は p/n 、すなわち母数の個数を点の個数で割ったものである。これは DFFITS 値が(正規分布の場合)pnppn と t 変数の積である。したがって、同書の著者は DFFITS が 2pn より大きい場合を外れ点としてチェックすることを薦めている。

類似の量にテンプレート:Ill2がある。

文献

テンプレート:Reflist

テンプレート:Statistics-stub