分散拡大係数のソースを表示
←
分散拡大係数
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
{{Redirect|VIF|ネットワーク用語|仮想ネットワークインターフェイス}} [[統計学]]における'''分散拡大係数'''(ぶんさんかくだいけいすう、'''variance inflation factor''', '''VIF''')とは、[[回帰分析|最小二乗回帰分析]]における[[多重共線性]]の深刻さを定量化する。推定された回帰係数の[[分散 (確率論)|分散]](推定値の[[標準偏差]]の平方)が、多重共線性のためにどれだけ増加したかを測る指標を提供する。 == 定義 == 以下の ''k'' 個の独立変数を持った[[線形回帰|線形モデル]]([[:en:Linear_model|linear model]])を考える。 ''Y'' = ''β''<sub>0</sub> + ''β''<sub>1</sub> ''X''<sub>1</sub> + ''β''<sub>2</sub> ''X'' <sub>2</sub> + ... + ''β''<sub>''k''</sub> ''X''<sub>''k''</sub> + ''ε''. 推定値 ''β''<sub>''j''</sub> の[[標準誤差]]は ''s<sup>2</sup>''(''X''<sup>′</sup>''X'')<sup>−1</sup> の ''j''+1, ''j''+1 要素の平方根である。ここで、 ''s'' は2乗平均平方根誤差([[機械学習の評価指標|RMSE]])である(RMSE<sup>2</sup> は誤差項の真の分散 <math> \sigma^2 </math> の一致推定量である)。''X'' は[[計画行列]]である。''β''<sub>''j''</sub> の推定量の分散は次式で表される。 :<math> {\rm \widehat{var}}(\hat{\beta}_j) = \frac{s^2}{(n-1)\widehat{\rm var}(X_j)}\cdot \frac{1}{1-R_j^2}, </math> ここで、''R''<sub>''j''</sub><sup>2</sup> は、他の共変量に対する ''X''<sub>''j''</sub> の回帰における[[決定係数]]である(目的変数の ''Y'' は回帰に含めない)。これにより、係数推定の分散に関していくつかの因子の影響を分離する。 * ''s''<sup>2</sup>: 回帰面のデータの散らばりが大きくなると、係数の推定値の分散が大きくなる。 * ''n'': サンプルサイズが大きくなると、係数の推定値の分散が小さくなる。 * <math>\widehat{\rm var}(X_j)</math>: 共変量の分散が大きいと、係数の推定値の分散が小さくなる。 残りの項の 1 / (1 − ''R''<sub>''j''</sub><sup>2</sup>) が VIF である。係数の推定の不確かさに影響を与えるほかのすべての因子を反映している。ベクトル ''X''<sub>''j''</sub> が他の共変量に対する ''X''<sub>''j''</sub> の回帰における計画行列の各々の列に対して[[直交]]しているとき、 VIF が 1 となる。そうでない場合は、1 より大きくなる。VIF は変量のスケールに対して不変である(VIFを変えずに、定数 ''c''<sub>''j''</sub> によって ''X''<sub>''j''</sub> のスケーリングが可能)。 == 計算と分析 == 以下の3ステップにより、k 個の VIF を計算することができる。 === ステップ1 === 最初に、''X''<sub>i</sub>を目的変数とし、他の変数を説明変数とした最小二乗回帰を行う。 <sub>i</sub> = 1 であれば、以下のような等式となる。 :<math>X_1=\alpha_2 X_2 + \alpha_3 X_3 + \cdots + \alpha_k X_k + c_0 +e</math> ここで、''c''<sub>0</sub> は定数であり、''e'' は[[誤差]]である。 === ステップ2 === 次式により、<math>\hat\beta_i</math> に対する VIF ファクターを計算する。 : <math>\mathrm{VIF_i}= \frac{1}{1-R^2_i}</math> ここで、''R''<sup>2</sup><sub>''i''</sub> はステップ1における回帰の決定係数である。 === ステップ3 === <math>\operatorname{VIF}(\hat \beta_i)</math> の大きさを考慮し、[[多重共線性]]の程度を分析する。経験的に、 <math>\operatorname{VIF}(\hat \beta_i) > 10</math> であれば多重共線性の程度は大きい。 ソフトウェアによっては、VIFの逆数である許容誤差を計算する。 == 解釈 == VIF の平方根は、モデル中でその変数が他の予測子と互いに無相関である場合の[[標準誤差]]と比べて、どれほどその値が大きいかを示す。 === 例 === ある予測変数の VIF が仮に 5.27(√5.27 = 2.3) とする。これは、この予測変数の係数に対する標準誤差が、他の予測変数に対して互いに無相関であった場合と比べ、 2.3 倍大きいことを意味する。 == 実装 == * プログラミング言語 R の car パッケージの "vif" 関数 == 参考文献 == {{Reflist}} == 読書案内 == * {{cite book |last=Allison |first=P. D. |title=Multiple Regression: A Primer |page=142 |publisher=Pine Forge Press |location=Thousand Oaks, CA |year=1999 |isbn= }} * {{cite book |last=Hair |first=J. F. |last2=Anderson |first2=R. |last3=Tatham |first3=R. L. |last4=Black |first4=W. C. |title=Multivariate Data Analysis |publisher=Prentice Hall |place= Upper Saddle River, NJ |year=2006 |isbn= }} * {{cite book |last=Kutner |first=M. H. |last2= Nachtsheim |first2=C. J. |last3= Neter |first3=J. |title=Applied Linear Regression Models |edition=4th |location= |publisher=McGraw-Hill Irwin |year=2004 |isbn= }} * {{cite book |last=Longnecker |first=M. T. |last2=Ott |first2=R. L. |title=A First Course in Statistical Methods |page=615 |location= |publisher=Thomson Brooks/Cole |year=2004 |isbn= }} * {{cite journal |last=Marquardt |first=D. W. |year=1970 |title=Generalized Inverses, Ridge Regression, Biased Linear Estimation, and Nonlinear Estimation |journal= Technometrics |volume=12 |issue=3 |pages=591–612 [pp. 605–7] |doi=10.1080/00401706.1970.10488699 }} * {{cite book |last=Studenmund |first=A. H. |title=Using Econometrics: A Practical Guide |edition=5th |pages=258–259 |publisher=Pearson International |year=2006 |isbn= }} * {{cite journal |last=Zuur |first=A.F. |last2=Ieno| first2=E.N.|last3=Elphick|first3=C.S|year=2010 |title=A protocol for data exploration to avoid common statistical problems |journal=Methods in Ecology and Evolution |volume=1 |pages=3–14 |doi=10.1111/j.2041-210X.2009.00001x}} {{デフォルトソート:ふんさんかくたいけいすう}} [[Category:数学に関する記事]] [[Category:統計学]] [[Category:統計]] [[Category:分析]]
このページで使用されているテンプレート:
テンプレート:Cite book
(
ソースを閲覧
)
テンプレート:Cite journal
(
ソースを閲覧
)
テンプレート:Redirect
(
ソースを閲覧
)
テンプレート:Reflist
(
ソースを閲覧
)
分散拡大係数
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報