ベイズ因子のソースを表示
←
ベイズ因子
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
{{ベイズ統計学}} '''ベイズ因子'''(ベイズいんし、{{lang-en-short|Bayes factor}})は、[[ベイズ統計学]]において、伝統的[[統計学]]の[[仮説検定]]に代わる方法として用いられる数値である。 [[データ]][[ベクトル]]'''''x''''' に基づいて2つの数学的モデル ''M''<sub>1</sub> と ''M''<sub>2</sub> のどちらかを選択する問題を考える。ここで、ベイズ因子 ''K'' は :<math>K = \frac{p(x|M_1)}{p(x|M_2)}</math> で与えられる。この方法は[[尤度比検定]]あるいは[[最尤法]]に似ているが、[[尤度]](モデルあるいは[[母数]]を定数とし、それを条件とする確率変数'''''x''''' の[[条件付き確率]]のこと)を'''最大化'''するのでなく、母数を[[確率変数]]とし、それに対して'''平均値'''をとってから最大化するところが違う。一般にモデルは母数ベクトル(複数の母数を[[ベクトル]]として扱う)によって規定される。これらを''M''<sub>1</sub> に対して θ<sub>1</sub> 、 ''M''<sub>2</sub> に対して θ<sub>2</sub> としよう。''K'' は :<math>K = \frac{p(x|M_1)}{p(x|M_2)} = \frac{\int \,p(\theta_1|M_1)p(x|\theta_1, M_1)\,d\theta_1}{\int \,p(\theta_2|M_2)p(x|\theta_2, M_2)\,d\theta_2}</math> で与えられる。この''K'' の[[対数]]をとり、「データ '''''x''''' によって与えられる ''M''<sub>2</sub> を基準とした''M''<sub>1</sub> の'''証拠の重み'''(weight of evidence)」と呼ぶこともある。単位は[[ビット]](2を底にした場合)など。 ''K'' > 1 は、''M''<sub>1</sub> の方が ''M''<sub>2</sub> よりも確からしいということをデータが示しているということであり、''K'' < 1となればちょうどその逆となる。それに対し、古典的な仮説検定は一方の仮説(またはモデル)に'''反する'''証拠しか考慮対象にしていない(つまり両仮説は不可逆である)という点が、大きく異なる。 == 例 == 成功か失敗かどちらかの結果になる[[確率変数]]を考えよう。成功[[確率]] ''q'' = ½ とするモデル ''M''<sub>1</sub> と、''q'' が全く不明で ''q'' の事前確率として[0,1]区間の[[一様分布]]をとるモデル ''M''<sub>2</sub> とを考えることにする。200標本を抽出し、そのうち成功が115、失敗が85だとする。尤度は: :<math>{{200 \choose 115}q^{115}(1-q)^{85}}</math> したがってモデル ''M''<sub>1</sub> で上の結果が出る確率は :<math>P(X=115|M_1)={200 \choose 115}\left({1 \over 2}\right)^{200}=0.00595...\,</math> となるが、モデル ''M''<sub>2</sub> でのそれは :<math>P(X=115|M_2)=\int_0^1{200 \choose 115}q^{115}(1-q)^{85}dq = {1 \over 201} = 0.00497...\,</math> ゆえに比は1.197...、つまりごくわずかに ''M''<sub>1</sub>を支持するものの、「ほとんど意味がない」程度である。 一方、古典的な尤度比検定を考えてみよう。''q'' の最尤推定量 <sup>115</sup>⁄<sub>200</sub> = 0.575 が得られる。これに基づくモデルを ''M''<sub>2</sub> として、0.1045...という比が得られ、ゆえに ''M''<sub>2</sub> が支持されることになる。''M''<sub>1</sub> を帰無仮説として片側検定を行うと、''q'' = ½ ならば200標本から115またはそれ以上の成功を得る確率は0.0200... であり、両側検定でも成功115回またはそれ以上極端な結果を得る確率は0.0400... だから、「 ''M''<sub>1</sub> は信頼水準5%で棄却される」(115は100から2標準偏差以上離れている)というさらに顕著な結果が得られる。 ''M''<sub>2</sub> は自由な母数を持つので、''M''<sub>1</sub> よりも複雑で厳密なモデルであるといえる。ここにベイズ因子の価値がある。 == 再現性 == {{main|再現性の危機}} 2017年6月に72人の著名な研究者が、新たな発見をしたと主張する際の証拠の統計的基準の低さが再現性の危機の一因になっているとする論文を発表した。新発見の統計的有意性を評価するために、科学者が好んで用いるP値の閾値は0.05から'''0.005'''に引き下げるべきであると、[[統計学]]の大家たちは主張する。その一方、[[イリノイ工科大学]]の[[計算機科学]]者Shlomo Argamonは「実験する方法が多数ある限り、どんなに小さいP値の閾値を用いてもその中に一つの実験方法が偶然に有意になる可能性が極めて高い」と新しい方法論的な基準を求める。実際小さいP値の閾値を用いたら[[お蔵入り問題]]がより著しくなり、多数の論文が出版できなくなる。その結果、多くの学者たちはP値の使用を停止し、代わりにベイズ因子を多用するようになった<ref>{{Cite journal |last=Chawla |first=Dalmeet Singh |date=2017-11 |title=統計学の大物学者がP値の刷新を提案 |url=https://www.natureasia.com/ja-jp/ndigest/v14/n11/%E7%B5%B1%E8%A8%88%E5%AD%A6%E3%81%AE%E5%A4%A7%E7%89%A9%E5%AD%A6%E8%80%85%E3%81%8CP%E5%80%A4%E3%81%AE%E5%88%B7%E6%96%B0%E3%82%92%E6%8F%90%E6%A1%88/89721 |journal=Nature Digest |volume=14 |issue=11 |pages=18–19 |DOI=10.1038/ndigest.2017.171118 |doi=10.1038/ndigest.2017.171118 |issn=1880-0556}}</ref>。 == 脚注 == {{reflist}} {{統計学}} {{DEFAULTSORT:へいすいんし}} [[Category:ベイズ統計]] [[Category:確率論]] [[Category:統計検定]] [[Category:トーマス・ベイズ]] [[Category:数学に関する記事]] [[Category:数学のエポニム]]
このページで使用されているテンプレート:
テンプレート:Cite journal
(
ソースを閲覧
)
テンプレート:Lang-en-short
(
ソースを閲覧
)
テンプレート:Main
(
ソースを閲覧
)
テンプレート:Reflist
(
ソースを閲覧
)
テンプレート:ベイズ統計学
(
ソースを閲覧
)
テンプレート:統計学
(
ソースを閲覧
)
ベイズ因子
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報