パネルデータ分析

提供: testwiki
ナビゲーションに移動 検索に移動

パネル・データテンプレート:Lang-en-short)とは、時系列データとクロスセクションデータを合わせたデータであり、同時に多数の個人、地域、事業所などを観察する一方で、複数の観察時点では同一の観察対象を維持するものである。自然科学のみならず、社会学経済学等の社会科学における統計的な分析にも使用される。

パネルデータの例

バランスド・パネル アンバランスド・パネル
personyearincomeagesex120031500271120041700281120052000291220032100412220042100422220052200432 personyearincomeagesex120031500271120041700281220032100412220042100422220052200432320043000351

上記の例では、個人間のクロスセクション・データと期間ごとの時系列データからなる2つの例が示されている。ここでは、個人の特徴が所得(income)・年齢(age)・性別(sex)で示されている。左側の例での個人1と個人2については、データ期間が2003年・ 2004年・2005年の3期間示されており、これをバランスド・パネルと呼ぶ。一方、右側は、個人2のみ2003年・ 2004年・2005年の3期間のデータ含まれるものの、個人1は2003年・ 2004年の2期間、個人3は2004年の1期間のみであり、アンバランスド・パネルと呼ばれる。

パネルデータを用いた回帰分析

パネルデータは以下のような形式をとる。

Xi,t,i=1,,N,t=1,,T

ここで、i は各個人を示し、そして、 t は期間を示す。

パネル・データを用いた回帰分析は一般的に以下のように示すことができる。

yi,t=α+βXi,t+ui,t

この式の通り、誤差項 ui,t が、μi と νi,t に分離されていることがパネル・データ分析の特質の1つである。

これは主に 固定効果モデルランダム効果モデルと呼ばれるモデルにてパラメータを推定する。

固定効果モデルは、

yi,t=α+βXi,t+ui,t
ui,t=μi+νi,t

であり、μi は個人に特有であり、時間を通じて変化しない一定な効果(例えば、クロスカントリー比較でのパネルデータであれば、地理的条件や気候など)である。

これに加えて、ランダム効果モデルとは、

μii.i.d.N(0,σμ2)

そして、

νi,ti.i.d.N(0,σν2)

となり、即ち、 誤差項の構成要素が互いに独立であることを意味する。


参考文献

関連項目

外部リンク

テンプレート:Economy-stub テンプレート:Statistics-stub テンプレート:Normdaten