外れ値のソースを表示
←
外れ値
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
{{Expand English|date=2025年2月}} [[File:Outlier statistics.svg|thumb|外れ値(中央の赤い点)]] '''外れ値'''(はずれち、{{lang-en-short|outlier}})は、[[統計学]]において、他の値から大きく外れた値のこと。測定ミス・記録ミス等に起因する[[異常値]]とは概念的には異なるが、実用上は区別できないこともある。[[ロバスト]]統計では、外れ値に対しての[[頑健性]]確保を重視する。 英語のoutlierには「他より著しく異なるため一般的結論を導けない人や物や事実」を指す意味もある<ref>[https://dictionary.cambridge.org/ja/dictionary/english/outlier outlier] Cambridge Dictionary, Cambridge University Press</ref><ref>[https://kotobank.jp/word/%E3%83%9E%E3%83%AB%E3%82%B3%E3%83%A0%20%E3%82%B0%E3%83%A9%E3%83%83%E3%83%89%E3%82%A6%E3%82%A7%E3%83%AB-1680897 マルコム グラッドウェル(英語表記)Malcolm Gladwell]コトバンク</ref>。 ==検定== 外れ値かどうか[[仮説検定|検定]]したい標本について、[[偏差]]を不偏[[標準偏差]]で割った[[検定統計量]] :<math> \tau_1 = \frac{ x_1 - \mu } \sigma </math> を求め(''x''{{sub|1}} は標本値、''μ'' は[[平均]]、''σ'' は標準偏差)、この値([[両側検定]]をする場合はこの[[絶対値]])が有意点より大きいかどうかで検定する。 簡単な方法では、2または3を有意点とする。つまり、''μ'' ± 2–3 ''σ'' の外なら外れ値とする。 ===スミルノフ・グラブス検定=== より精密には、[[正規分布]]を仮定して、スミルノフ・グラブス ({{en|Smirnov‐Grubbs}}) 検定を使う。サンプルサイズを ''n''、所要の[[有意水準]]を ''α''、[[自由度]] ''n'' - 2 の[[t分布]]の ''α'' / ''n'' × 100 [[パーセンタイル]]を ''t'' として、 :<math> \tau = \frac{ (n - 1) t }{ \sqrt{ n(n - 2) + n t ^ 2 } } </math> を有意点とする。平均値から最も外れている1つのデータのみを検定し、それが外れ値と判定されたら、それを除外した ''n'' - 1 のサンプルサイズにおいて最も外れているデータを検定し、以下、外れ値が検出されなくなるまでこれを繰り返す。 ===トンプソン検定=== トンプソン ({{en|Thompson}}) 検定では、 :<math>t = \frac{ \tau \sqrt{n - 2} }{ \sqrt{ n - 1 - \tau ^ 2 } } </math> を使う。計算式の都合上、スミルノフ・グラブス検定とは逆に、標本値の検定統計量 ''τ''{{sub|1}} から ''t''{{sub|1}} を経て有意水準 ''α''{{sub|1}} を求めることが多い。''n'' が十分大きければスミルノフ・グラブス検定と同じ結果になる。 == 脚注 == {{脚注ヘルプ}} {{Reflist}} == 関連項目 == * [[Huber損失]] ==外部リンク== {{Commons category|Outliers}} *[http://aoki2.si.gunma-u.ac.jp/lecture/Grubbs/Grubbs-table.html スミルノフ・グラブス検定の有意点] {{統計学}} {{Normdaten}} {{DEFAULTSORT:はすれち}} [[Category:統計]] [[Category:データ分析]] [[Category:数学に関する記事]]
このページで使用されているテンプレート:
テンプレート:Commons category
(
ソースを閲覧
)
テンプレート:En
(
ソースを閲覧
)
テンプレート:Expand English
(
ソースを閲覧
)
テンプレート:Lang-en-short
(
ソースを閲覧
)
テンプレート:Normdaten
(
ソースを閲覧
)
テンプレート:Reflist
(
ソースを閲覧
)
テンプレート:Sub
(
ソースを閲覧
)
テンプレート:統計学
(
ソースを閲覧
)
テンプレート:脚注ヘルプ
(
ソースを閲覧
)
外れ値
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報