十分統計量のソースを表示
←
十分統計量
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
{{出典の明記|date=2015年9月}} '''十分統計量'''(じゅうぶんとうけいりょう)とは、'''十分性'''を持つ[[統計量]]を指す。[[統計量]]が十分性を持つ、また十分であるとは、その[[統計量]]が下記の性質を満たすことを指す。 : ある[[統計]][[データ]]に対し、それが従う[[確率分布]]を示す[[母数]] ''θ'' に対応するその統計量の値が決められた条件下で、データが出現する[[条件付き確率]]分布が、もはや''θ'' にはよらない。<!--この統計量は'''十分'''である('''十分統計量''')という。この性質を統計量の'''十分性'''(じゅうぶんせい)と呼ぶ。--> 直感的にいうと、「母数''θ''(直接は求められず、推定しかできない)に対する十分統計量は、''θ'' の統計学的推定に関する限り、データから得られる[[情報]]を漏らさず含んでいる」ということになる<ref>例えて言えば、二つのさいころの目の和だけで物事が決まり、個別の目の組み合わせについては無関係となる場合には、目の和だけで話が十分ということを指している。</ref>。 十分統計量は[[ロナルド・フィッシャー]]によって導入された、[[推計統計学|統計学的推定]]において基本的な概念である。 ==定義== [[確率変数]]''X'' に対する統計量''T''(''X'') の値が与えられた条件下で、データ''x'' の従う条件付き確率分布が母数 ''θ'' と[[独立 (確率論)|独立]]である場合、かつその場合に限り、「''T''(''X'')は''θ'' に対して十分である」という。すなわち: :<math>\Pr(X=x \mid T(X)=t,\,\theta) = \Pr(X=x \mid T(X)=t)</math> 簡単に書けば <math>\Pr(x \mid t,\,\theta) = \Pr(x \mid t)</math> である。従って :<math>\Pr(x \mid \theta) = \Pr(x,t \mid \theta) = \Pr(x \mid t,\,\theta) \cdot \Pr(t \mid \theta) = \Pr(x \mid t) \cdot \Pr(t \mid \theta)</math> である。 ===フィッシャーの因子分解定理=== 十分統計量を決定する基準として、フィッシャーの因子分解定理がある。これは、 :''X'' の[[確率密度関数]](離散的な場合には確率質量関数)を''f''(''x'' ;''θ'') (これは[[尤度関数]]に等しい)とすると、ある[[関数 (数学)|関数]] ''g'' と ''h'' が次の関係にある場合、かつその場合に限り、''T'' は''θ'' に対して十分である: :<math>f(x;\,\theta)=h(x) \, g(T(x);\,\theta)</math> :つまり、密度関数 ''f'' が分解できて、1つの因子 ''h'' が ''θ'' に依存せず、またもう1つの因子が ''T''(''x'') を通してのみ ''x'' に依存するようにできる というものである。これは次のように考えるとわかりやすい。''T''(''X'') の値を一定に保ちながらデータ ''x'' の値を変え、このような変化が ''θ'' に関する推定に影響するかどうかを考えてみる。上の式が成り立つならば、尤度関数 ''f'' の''θ'' に対する依存性は変化しないから、影響はないのである。 :これが成立するならこの統計量は良いものであるというわけではない。しかし、少なくともこの条件を満たしていない統計量に良い結果は望めない。 ==例== ===ベルヌーイ分布=== <math>X_1, \dots, X_n</math> を[[ベルヌーイ分布]]に従う独立な確率変数、その[[期待値]]を<math>p</math>とすると、和<math>T(X) = X_1 + \dots + X_n</math> が、<math>p</math>に対する十分統計量となる(ここで「成功」は <math>X_i=1</math> に、「失敗」は<math>X_i=0</math> に当たる。従って <math>T</math> は総成功回数である)。 これは次の同時確率分布をみればわかる: :<math> \Pr(X=x)=P(X_1=x_1,X_2=x_2,\ldots,X_n=x_n)</math> 各観察は独立だから、次のように書き換えられる: :<math>p^{x_1}(1-p)^{1-x_1} p^{x_2}(1-p)^{1-x_2}\cdots p^{x_n}(1-p)^{1-x_n} \,\!</math> そして''p'' と 1 − ''p'' の累乗を集めて、 :<math>p^{\sum x_i}(1-p)^{n-\sum x_i}=p^{T(x)}(1-p)^{n-T(x)} \,\!</math> これは因子分解基準に合致し、''h''(''x'')=1 となる。 特に注目すべきは、不明の母数''p'' が、統計量 ''T''(''x'') = Σ ''x''<sub>''i''</sub> を通じてのみ、観察値 ''x'' に関係することである。 ===一様分布=== ''X''<sub>1</sub>, ...., ''X''<sub>''n''</sub> を、[[一様分布]]に従う独立な確率変数([0,θ]の値をとる)とすると、''T''(''X'') = max(''X''<sub>1</sub>, ...., ''X''<sub>''n''</sub> )が、θ に対する十分統計量である。 これは次の同時確率分布をみればわかる: :<math>\Pr(X=x)=P(X_1=x_1,X_2=x_2,\ldots,X_n=x_n)</math> 観察値は互いに独立だから、次のように書き換えられる: :<math>\frac{\operatorname{H}(\theta-x_1)}{\theta}\cdot \frac{\operatorname{H}(\theta-x_2)}{\theta}\cdot\,\cdots\,\cdot \frac{\operatorname{H}(\theta-x_2)}{\theta}\cdot\,\cdots\,\cdot \frac{\operatorname{H}(\theta-x_n)}{\theta} \,\!</math> ここで H(''x'') は[[ヘヴィサイドの階段関数]]である。さらに書き換えて: :<math>\frac{\operatorname{H}\left(\theta-\max_i \{\,x_i\,\}\right)}{\theta^n}\,\!</math> これは''θ'' だけの関数と見なすことができ、max<sub>i</sub>(''X''<sub>i</sub>) = ''T''(''X'') となる。これから因子分解条件が成り立ち、今回も ''h''(''x'') = 1 となる。 ===ポアソン分布=== ''X''<sub>1</sub>, ...., ''X''<sub>''n''</sub> を、母数''λ'' の[[ポアソン分布]]に従う独立な確率変数とする。和 ''T''(''X'') = ''X''<sub>1</sub> + ... + ''X''<sub>''n''</sub> が ''λ'' に対する十分統計量である。同時確率は: :<math>\Pr(X=x)=P(X_1=x_1,X_2=x_2,\ldots,X_n=x_n).</math> 観察は独立であるから、次のように書き換えられる: :<math>{e^{-\lambda} \lambda^{x_1} \over x_1 !} \cdot {e^{-\lambda} \lambda^{x_2} \over x_2 !} \cdot\,\cdots\,\cdot {e^{-\lambda} \lambda^{x_n} \over x_n !} \,\!</math> さらに :<math>e^{-n\lambda} \lambda^{(x_1+x_2+\cdots+x_n)} \cdot {1 \over x_1 ! x_2 !\cdots x_n ! } = e^{-n\lambda} \lambda^{T(x)} \cdot {1 \over x_1 ! x_2 !\cdots x_n ! } \,\!</math> これから因子分解条件が成り立ち、''h''(''x'') は全変数の階乗の積の逆数である。 ==ラオ・ブラックウェルの定理== 十分統計量 ''T''(''X'') が与えられれば''X'' の条件付き分布は''θ'' によらないので、''T''(''X'') が与えられた条件での任意の関数(ただし条件付き期待値が定義できるとする)''g''(''X'') の条件付き期待値も母数''θ'' にはよらない。従ってこのような条件付き期待値も統計量であり、推定に用いることができる。 十分性に関して重要な定理に、ラオ・ブラックウェルの定理がある。この定理は、「''g''(''X'') を''θ'' の[[推定量]](どんな種類の推定量でもよい)とすれば、十分統計量''T''(''X'') のもとでの''g''(''X'') の条件付き期待値は''θ'' のよい推定量(他の推定量より悪くなることはない)である」というものである。 これを利用して、大雑把な推定量 ''g''(''X'') が得られたら、これから条件付き期待値を求めることで、最適な推定量が得られる。 ==脚注== <references/> ==関連記事== *[[推測統計学]] *[[確率分布]] *[[確率密度関数]] *[[統計量]] *[[母数]] *[[推定量]] *[[条件付き確率]] *[[尤度関数]] {{デフォルトソート:しゆうふんせい}} [[Category:統計学の原理]] [[Category:ロナルド・フィッシャー]] [[Category:数学に関する記事|しゆうふんせい]]
このページで使用されているテンプレート:
テンプレート:出典の明記
(
ソースを閲覧
)
十分統計量
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報