68–95–99.7則のソースを表示
←
68–95–99.7則
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
[[ファイル:Empirical rule histogram.svg|サムネイル|250px|[[正規分布]]近似において平均から1σ(プラスマイナス標準偏差)範囲には約68%の要素が含まれ、2σ範囲には約95%、3σ範囲には約 99.7%が含まれる。図内のパーセンテージは[[丸め]]られた値である。]] [[ファイル:Standard score and prediction interval.png|サムネイル|250px|標準化した残差''z''(横軸)と、事象が生じる間隔の期待値(縦軸・対数軸)。]] [[統計学]]における'''68–95–99.7則'''({{lang-en-short|68–95–99.7 rule}})とは、[[正規分布]]において、[[平均値]]を中心とした[[標準偏差]]の2倍、4倍、6倍の幅に入るデータの[[割合]]の簡略表現である。より正確には、68.27%、95.45%、 99.73%である。 数学的には、[[平均]] {{Math|μ}} で[[標準偏差]] {{Math|σ}} の[[正規分布]]に従う[[確率変数]] {{Math|X}} は以下の式に従うことが述べられている。 : <math>\begin{align} \Pr(\mu-\;\,\sigma \le X \le \mu+\;\,\sigma) &\approx 0.6827 \\ \Pr(\mu-2\sigma \le X \le \mu+2\sigma) &\approx 0.9545 \\ \Pr(\mu-3\sigma \le X \le \mu+3\sigma) &\approx 0.9973 \end{align}</math> [[経験論]]的には、いわゆる「3シグマのルール」や「千三ツの法則」と呼ばれるものであり、ほぼすべての値が平均の3標準偏差以内にあるという従来のヒューリスティックを表している<ref>this usage of "three-sigma rule" entered common usage in the 2000s, e.g. cited in {{Cite book|title=Schaum's Outline of Business Statistics|year=2003|publisher=McGraw Hill Professional|page=359|postscript=none}}, and in {{Cite book|last=Grafarend|first=Erik W.|title=Linear and Nonlinear Models: Fixed Effects, Random Effects, and Mixed Models|year=2006|publisher=Walter de Gruyter|page=553}}</ref>。このヒューリスティックの便利さは置いている仮定に非常に大きく左右される。社会科学においては、2σ以上外れた値(95%信頼区間の外)が「[[有意]]」とされ、[[素粒子物理学]]の分野では、5σ (99.99994%信頼区間の外)が「発見」に必要だとされている。 「3シグマのルール」では正規分布に従わない場合でも、少なくとも、88.8%のデータは μ±3σ の範囲内に入る。これは、[[チェビシェフの不等式]](kσの外にはたかだか1/k<sup>2</sup> のデータしか存在し得ない)から導かれる。単峰分布においては、少なくとも95%であり、少なくとも98%まで上げるには一定の前提が必要かもしれない。 :<math>\Pr (\left| X-\mu \right| \leq k\sigma )\geq 1 - \frac{1}{k^2}</math> == 累積分布関数 == [[ファイル:Cumulative distribution function for normal distribution, mean 0 and sd 1.png|サムネイル|250px|平均が0、標準偏差が1である正規分布の累積分布関数]] “68%, 95%, 99.7%” は標準正規分布の累積分布関数に由来している。 任意の[[偏差値]] ''z'' の期待幅は、(1−(1−Φ<sub>''µ'',''σ''<sup>2</sup></sub>(z))·2)に対応する。 例えば、2σの範囲、つまり{{Math|Φ(2) ≈ 0.9772}}もしくは{{Math|Pr(''X'' ≤ ''μ'' + 2''σ'') ≈ 0.9772}}は、(1 − (1 − 0.97725)·2) = 0.9545 = 95.45%に対応する。しかしこの間隔は対称的ではない。観測値が {{Math|''μ'' + 2''σ ''}}である確率に過ぎない。観測値が平均値から±2σの範囲に含まれる確率は(丸め誤差を含むが) : <math>\Pr(\mu-2\sigma \le X \le \mu+2\sigma) = \Phi(2) - \Phi(-2) \approx 0.9772 - (1 - 0.9772) \approx 0.9545 </math> と計算できる。 これは95%信頼区間 <math>\bar{X} \pm 2\frac{\sigma}{\sqrt{n}}</math> に関係している(ただし ''n'' サンプルの平均値を <math>\bar{X}</math> とする)。 == 正規性検定 == “68–95–99.7 則” は、標本からその母集団が正規分布であるかの簡易的な評価をするためによく用いられる。また、母集団を正規分布と仮定した場合の[[外れ値]]の単純な検定や、母集団が{{訳語疑問点範囲|正規分布かもしれないに|date=2018年4月}}正規性検定としても使用される。 標本{{訳語疑問点範囲|の変換するには|date=2018年4月4日}}、平均(母集団の平均がわからない場合には推定する)・[[分散 (確率論)|分散]]を計算し、標本の値から平均の値を引くことで[[残差]]を計算する。そして、残差を標準偏差で割ることで[[偏差値]]を得る(ただし偏差値はここに書いたとおり残差を標準偏差で割った値であり、平均値が50、標準偏差が10となるように標本変数を規格化したものではなく、どちらかというとスチューデント化残差に近い)。 外れ値の検定や正規性の検定に用いる場合、標準偏差とその範囲に存在するデータの割合を比較する。標本の[[スチューデント化残差]]を計算し、正規分布でのデータの割合の期待値と比較する。(標本のサイズが十分大きい場合を除き、極端なデータとされるため)3σ以上の残差を持つデータは外れ値とされることが多い。平均から3σ以上に多くのデータがある場合正規分布ではないと疑われやすい。また、この考え方は4σ以上離れている場合より顕著である。 より正確には、[[ポアソン分布]]を用いて与えられた大きさ以上の残差のデータ数を近似して計算できるが、1000点の標本に4σ以上の残差を持つデータがある場合、正規性に疑問を呈する。 例えば、6σのデータは約2億分の1の確率に相当する。事象が毎日発生する場合、このデータは140万年に一度しか生じないデータに対応する。つまり、とある日のデータで6σが観測され、その観測期間が100万年を大幅に下回る場合、正規分布は良いモデルを提供しない可能性が高いといえる。 [[ナシム・ニコラス・タレブ]]は著書 ''The Black Swan'' の中で、[[ブラックマンデー]]が36σの事象に対応するリスクモデルの例を示している。そのようなイベントが発生すると、モデルに欠陥がある、つまり、正規分布によるモデル化は適切でないことが即座に示唆され、その後、[[確率的ボラティリティモデル]]などのより洗練されたモデルで考慮する必要がある。このような議論では、まれな出来事をたったひとつ観測しただけでは、そのような事実はまれであるということに矛盾しないという[[ギャンブラーの誤謬]]の問題を認識することが重要である{{要出典|date=November 2016}}。まれな事象が生じることは、「まれな事象がまれである」という仮説、すなわち仮定されたモデルの妥当性を損なう。仮説の信頼性が徐々に失われる場合、このプロセスを適切にモデリングするには、仮説そのものの見直しだけでなく、[[事前確率]]を指定する必要がある場合もある。このため、{{訳語疑問点範囲|統計的[[仮説検定]]は、起きやすい事象を確認することではなく、あまり効果を発揮せず、|date=2018年4月4日 (水) 14:42 (UTC)}}疑わしい仮説(起きにくい事象)を反駁することによって、効果を発揮する。 == 数値データの表 == 正規分布は裾野において指数関数的に確率は減少するため、残差の大きなデータは指数関数的に減少する。標準正規分布に従う1日に一回起きる事象は、統計的には以下の表に示す頻度で生じる。 {| class="wikitable" style="text-align: center" !範囲 !範囲内に含まれる割合の期待値 !範囲外に含まれる割合の期待値の近似 !生じる頻度の近似 |- |μ ± 0.5σ |{{val|0.38292492254802621|end=...}} | 2/3 |週に4度 |- |μ ± σ |{{val|0.68268949213708590|end=...}} | 1/3 |週に2度 |- |μ ± 1.5σ |{{val|0.86638559746228387|end=...}} | 1/7 |週に1度 |- |μ ± 2σ |{{val|0.95449973610364159|end=...}} | 1/22 |3週間に1度 |- |μ ± 2.5σ |{{val|0.98758066934844773|end=...}} | 1/81 |四半期に1度 |- |μ ± 3σ |{{val|0.99730020393673981|end=...}} | 1/370 |1年に1度 |- |μ ± 3.5σ |{{val|0.99953474184192895|end=...}} | 1/{{val|2149}} |6年に1度 |- ||μ ± 4σ |{{val|0.99993665751633376|end=...}} | 1/{{Val|15787}} |43年に1度 (一生に2度) |- |μ ± 4.5σ |{{val|0.99999320465375054|end=...}} | 1/{{Val|147160}} |403年に1度 |- |μ ± 5σ |{{val|0.99999942669685624|end=...}} | 1/{{Val|1744278}} |{{Val|4776}}年に1度 |- |μ ± 5.5σ |{{val|0.99999996202087507|end=...}} | 1/{{Val|26330254}} |{{Val|72090}}年に1度([[ホモ・サピエンス]]時代に3度) |- |μ ± 6σ |{{val|0.99999999802682471|end=...}} | 1/{{Val|506797346}} |138万年に1度([[ヒト属]]が生まれてから2度) |- |μ ± 6.5σ |{{val|0.99999999991967999|end=...}} | 1/{{Val|12450197393}} |3400万年に1度 ([[K-Pg境界|恐竜の絶滅]]から2度) |- |μ ± 7σ |{{val|0.99999999999744037|end=...}} |1/{{Val|390682215445}} |10億7000万年に1度(地球の歴史で4度) |- |μ ± {{Math|<var>x</var>}}σ | [[誤差関数|<math>\operatorname{erf}\left(\frac{x}{\sqrt{2}}\right)</math>]] |<math>1-\operatorname{erf}\left(\frac{x}{\sqrt{2}}\right)</math> |<math>\tfrac{1}{1-\operatorname{erf}\left(\frac{x}{\sqrt{2}}\right)}</math> |} == 脚注 == {{脚注ヘルプ}} {{reflist}} == 関連項目 == * [[有意#P値|有意]] * [[シックス・シグマ]] * [[偏差値]] * [[t検定|''t''検定]] == 外部リンク == * "[http://www-stat.stanford.edu/~naras/jsm/NormalDensity/NormalDensity.html The Normal Distribution]" by Balasubramanian Narasimhan * "[http://www.wolframalpha.com/input/?i=erf%28x%2Fsqrt%282%29%29 Calculate percentage proportion within ''x'' sigmas] at WolframAlpha {{DEFAULTSORT:68-95-99.7そく}} [[Category:正規分布]] [[Category:統計学的近似]] [[Category:経験則]] [[Category:数学に関する記事]]
このページで使用されているテンプレート:
テンプレート:Cite book
(
ソースを閲覧
)
テンプレート:Lang-en-short
(
ソースを閲覧
)
テンプレート:Math
(
ソースを閲覧
)
テンプレート:Reflist
(
ソースを閲覧
)
テンプレート:Val
(
ソースを閲覧
)
テンプレート:脚注ヘルプ
(
ソースを閲覧
)
テンプレート:要出典
(
ソースを閲覧
)
テンプレート:訳語疑問点範囲
(
ソースを閲覧
)
68–95–99.7則
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報