Horvitz–Thompson推定量

提供: testwiki
2022年5月4日 (水) 15:07時点における60.72.64.120 (トーク)による版 (外部リンク)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

Horvitz–Thompson推定量(Horvitz–Thompsonすいていりょう)は、層化抽出された疑似母集団における合計および平均を推定する統計学的手法であり、Daniel G. Horvitz と Donovan J. Thompson にちなんで名付けられた[1][2]逆確率重み付けを適用する。Horvitz–Thompson推定量は調査分析に頻繁に適用され、欠測データなどを説明するために用いられる。

方法

Yi(i=1,2,,n)N 個の層から抽出した n 個の独立な標本とし、平均を μとする。さらに、πii 番目の層に含まれる超母集団から抽出される確率とする。

合計のHansenand-Hurwitz推定量(1943年)は、次式で与えられる[3]

Y^HT=i=1nYiπi

平均のHorvitz–Thompson推定量は、次式で与えられる。

μ^HT=Y^HTN=1Ni=1nYiπi

ベイズの確率論的枠組みでは、πi はターゲット母集団の中で i 番目の層に属する個体の割合と考えることができる。それゆえ、Yi/πi は、i 番目の層に属する人の完全なサンプリングの推定値と考えることができる。 また、Horvitz-Thompson推定値は、平均の重み付きブートストラップリサンプリング推定量の限界値として表すこともできる。多重代入法の特殊なケースと見なすこともできる[4]

層別化後の研究デザインの場合、 π の推定と μ の推定は、異なるステップで行われる。そのような場合、μ^HT の分散の計算は容易ではない。ブートストラップやジャックナイフといったリサンプリング手法を適用して、Horvitz-Thompson推定量の分散を推定できる[5]Rの survey パッケージは、Horvitz–Thompson推定量を使用して層化後データを分析する[6]

平均のHorvitz-Thompson推定量の不偏性の証明

Horvitz-Thompson推定量の期待値 𝔼(X¯nHT)を評価することで、Horvitz-Thompson推定量の不偏性を示すことができる。

𝔼(X¯nHT)=𝔼(1Ni=1n𝐗IiπIi)=𝔼(1Ni=1NXiπi1iDn)=b=1BP(Dn(b))[1Ni=1NXiπi1iDn(b)]=1Ni=1NXiπib=1B1iDn(b)P(Dn(b))=1Ni=1N(Xiπi)πi=1Ni=1NXi
ここで、Dn={x1,x2,...,xn}

Hansen-Hurwitz推定量(1943年)は、Horvitz-Thompsonの戦略(1952年)より劣っていることが知られている[7]

脚注

テンプレート:脚注ヘルプ テンプレート:Reflist

外部リンク

テンプレート:統計学

  1. William G. Cochran (1977), Sampling Techniques, 3rd Edition, Wiley. テンプレート:ISBN2
  2. Horvitz, D. G.; Thompson, D. J. (1952) "A generalization of sampling without replacement from a finite universe", Journal of the American Statistical Association, 47, 663–685, . テンプレート:JSTOR
  3. テンプレート:Cite book
  4. Roderick J.A. Little, Donald B. Rubin (2002) Statistical Analysis With Missing Data, 2nd ed., Wiley. テンプレート:ISBN2
  5. テンプレート:Cite journal
  6. https://cran.r-project.org/web/packages/survey/
  7. PRABHU-AJGAONKAR, S. G. "Comparison of the Horvitz-Thompson Strategy with the Hansen-Hurwitz Strategy." Survey Methodology (1987): 221. (pdf)