箱ひげ図のソースを表示
←
箱ひげ図
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
[[File:Simple-boxplot.svg|300px|thumb|[[アヤメ属|アヤメ類]]の[[花弁]]の長さの分布を種ごとに表す箱ひげ図([[:en:Iris flower data set|Iris flower data set]])]] '''箱ひげ図'''(はこひげず、箱髭図、{{lang-en-short|box plot、box-and-whisker plot}})は、データの[[統計的ばらつき]]をわかりやすく表現するための[[統計]]図である。主に多くの水準からなる分布を視覚的に要約し、比較するために用いる。[[ジョン・テューキー]]が1970年代に提唱した。様々な分野で利用されるが、特に[[品質管理]]で盛んに用いられる。'''箱'''({{en|box}})と、その両側に出た'''ひげ'''({{en|whisker}})で表現されることからこの名がある<ref>西岡康夫,数学チュートリアル やさしく語る 確率統計,1.6 箱ひげ図 p.13, オーム社, 2013, ISBN 9784274214073</ref>。 == 定義 == [[File:Elements of a boxplot en.svg|300px|right]] '''箱ひげ図'''は五数要約({{en|five-number summary}})と呼ばれる(頑健な)[[要約統計量]] * ''Q''<sub>0/4:</sub> 最小値({{en|minimum}}) * ''Q''<sub>1/4:</sub> 第1四分位点({{en|lower quartile}}) * ''Q''<sub>2/4:</sub> [[中央値]](第2四分位点、{{en|median}}) * ''Q''<sub>3/4:</sub> 第3四分位点({{en|upper quartile}}) *''Q''<sub>4/4:</sub> 最大値({{en|maximum}}) を表すグラフである。第1四分位点から第3四分位点までの高さに箱を描き、中央値で仕切りを描く。ただし、ひげや[[外れ値]]、箱の幅・形などの扱いにはいくつか[[#変種|変種]]がある。簡明なのは最大値と最小値をひげの端で表したものである。外れ値も扱うときには閉区間 :<math>[Q_{1/4} - 1.5 \, \mathrm{IQR}, \, Q_{3/4} + 1.5 \, \mathrm{IQR}] \qquad (\mathrm{IQR} = Q_{3/4} - Q_{1/4})</math> の外にあるものを(もしあれば)外れ値として個別に表示し、外れ値を除いたものの最大値・最小値にそれぞれひげの端をとる{{sfn|Dekking et al.|2005|loc={{google books quote|id=TEcmHJX67coC|page=236|16.4 The box-and-whisker plot}}}}<ref>[[R言語]]の<code>boxplot</code>もデフォルトではこのようにプロットする。</ref>。[[母集団]]は実際には様々なタイプの[[確率分布]]に従うわけだが、箱ひげ図はそのような仮定に関係なく、データの分布を表現することができる。箱の各部分の間隔から[[分散 (確率論)|分散]]や[[歪度]]の程度を知ることもできる。 == 例 == 以下に箱ひげ図の具体例を挙げる: [[ファイル:箱ひげ図の具体例.png|代替文=箱ひげ図の具体例|サムネイル|箱ひげ図の具体例|なし|407x407ピクセル]] このデータセット(値は図から読み取れる概略値とする)から、次のことが分かる。 * 最小値 = 0.5 * 第1四分位点 = 7 * 中央値(第2四分位点) 8.5 * 第3四分位点 = 9 * 最大値 = 10 * 四分位範囲(IQR) = 2 * 3.5という値は"軽度の"外れ値、つまり''Q''<sub>1/4</sub>よりも 1.5×IQR から 3×IQR だけ下にある * 0.5という値は"極端な"外れ値、つまり''Q''<sub>1/4</sub>よりも 3×IQR 以上下にある * 外れ値以外の最小値は5 * データは左に歪んでいる(負の歪度) "軽度"および"極端"外れ値の境は、箱の長さの2倍の点である。なお、この図からデータの平均値は読み取れない。 == 変種 == [[File:Fourboxplots.svg|right|300px]] いろいろな統計パッケージで使われている箱ひげ図の中には、違う方式(例えば5%点と95%点をひげの端にする)を採用したものもある。このような方式は、中央値を中心とする分布を強調するテューキーの方式と異なり、またデータサイズが10を越えただけで(分布の形によらず)外れ値を出してしまう傾向がある。 == 脚注 == {{reflist}} == 参考文献 == * {{cite book |last1 = Dekking |first1 = F. M. |last2 = Kraaikamp |first2 = C. |last3 = Lopuhaä |first3 = H. P. |last4 = Meester |first4 = L. E. |year = 2005 |title = A modern introduction to probability and statistics |series = Springer Texts in Statistics |url = {{google books|TEcmHJX67coC|plainurl=yes}} |publisher = Springer-Verlag |isbn = 978-1-85233-896-1 |mr = 2208349 |ref = {{sfnref|Dekking et al.|2005}} }} * {{Cite book|和書|author=西岡康夫|year=2013|title=数学チュートリアル やさしく語る 確率統計|publisher=オーム社|isbn=9784274214073}} ==関連項目== *[[要約統計量]] *[[ローソク足チャート]] *[[分位数]] == 外部リンク == * {{Cite web|和書 |url = http://www.stat.go.jp/koukou/howto/process/graph/graph5.htm |title = 箱ひげ図 |accessdate = 2016-03-29 |author = 総務省[[統計局]] |work = なるほど統計学高等部 }}—[[Excel]]で箱ひげ図を作る方法 * {{cite web |url=https://360digitmg.com/blog/what-is-box-plot |title=What is Box plot |accessdate=2023-07-08}}—[[R言語]]で箱ひげ図を作る方法 {{統計学}} {{DEFAULTSORT:はこひけす}} [[category:統計学]] [[category:品質管理]] [[Category:数学に関する記事]] [[Category:グラフ]]
このページで使用されているテンプレート:
テンプレート:Cite book
(
ソースを閲覧
)
テンプレート:Cite web
(
ソースを閲覧
)
テンプレート:En
(
ソースを閲覧
)
テンプレート:Lang-en-short
(
ソースを閲覧
)
テンプレート:Reflist
(
ソースを閲覧
)
テンプレート:Sfn
(
ソースを閲覧
)
テンプレート:統計学
(
ソースを閲覧
)
箱ひげ図
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報