分位数のソースを表示
←
分位数
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
'''分位数'''(ぶんいすう)、'''分位点'''(ぶんいてん)、'''分位値'''(ぶんいち)、'''クォンタイル''' ({{lang-en-short|quantile}}) は、統計の代表値の1種である。 [[実数]] <math>q \in [0, 1]</math> に対し、'''''q'' 分位数''' ({{en|''q''-quantile}}) は、分布を <math>q : 1 - q</math> に分割する値である。 ある種の正の[[整数]] <math>m</math> に対し、分布を <math>m</math> 等分する <math>m - 1</math> 個の値、つまり、<math>i = 1, \dotsc, m - 1</math> に対する <math>i / m</math> 分位数を、'''''m'' 分位数'''(ただし <math>m</math> は[[漢数字]])という。<math>i = 1, \dotsc, m - 1</math> 番目の ''m'' 分位数を'''第 ''i'' ''m'' 分位数'''といい、また、<math>m</math> 等分された分布の <math>k = 1, \dotsc, m</math> 番目の部分を、'''第 ''k'' ''m'' 分位'''、または単に'''第 ''k'' 分位'''という。 ただし、英語の{{en|quantile}}には、等分割する値({{en|value}})の意味と、そのようにして分割された群({{en|group}})の二つの意味がある<ref>{{citation |title=[[オックスフォード英英辞典|Oxford Dictionary of English]] |editor=Angus Stevenson |edition=Third |year=2010 |publisher=[[Oxford University Press]] |page={{google books quote|id=anecAQAAQBAJ|page=1451|1451}} |isbn=978-0-19-957112-3 }}</ref>。 ==定義== ===変量統計における分位数=== <math>n</math> 個のデータ <math>x</math> に対する ''q'' 分位数 <math>Q_q</math> は、昇順に[[ソート]]したデータを <math>x_{1} \leq x_{2} \leq \dotsb \leq x_{n}</math> とすると、 :<math>\begin{align} Q_q &= x(1 - q + q n) \\ x(t) &= \begin{cases} x_t, & \text{if } t \in \mathbb{N} \\ (\lceil t \rceil - t) x_{\lfloor t \rfloor} + (t - \lfloor t \rfloor) x_{\lceil t \rceil}, & \text{if } t \notin \mathbb{N} \end{cases} \end{align}</math> と定義される。ここで、<math>\lfloor \cdot \rfloor</math> は床関数、<math>\lceil \cdot \rceil</math> は天井関数、<math>\mathbb{N}</math> は[[自然数]]の集合である。 [[関数 (数学)|関数]] <math>x(t),\ 1 \le t \le n</math> は、[[数列]] <math>x_{1, \dotsc, n}</math> の線形内挿数関数への拡張である。関数 <math>x(\cdot)</math> の引数 <math>1 - q + q n</math> は、範囲 <math>[1, n]</math> を <math>q : 1 - q</math> に[[内分]]している。 ===確率分布の分位数=== 1次元[[確率分布]] <math>f(x)</math> に対する ''q'' 分位数 <math>Q_{q}</math> は :<math>\int_{-\infty}^{Q_q} f(x) dx \ge q,\ \int_{Q_q}^\infty f(x) dx \ge 1 - q</math> を満たす値として定義される。この式は、累積分布関数 <math>F(x)</math> または確率 <math>P(X)</math> を使って、 :<math>\int_{-\infty}^{Q_q} dF(x)\ \ge q,\ \int_{Q_q}^\infty dF(x)\ \ge 1 - q</math> または :<math>P(X \le Q_q) \ge q,\ P(X \ge Q_q) \ge 1 - q</math> とも表せる<ref>累積分布関数が(狭義)[[単調増加]]でなければ、この条件を満たす <math>Q_q</math> は一意に定まるとは限らない。<!-- infとsupの平均として一意になるように定義した方がよい? --></ref>。 ==特別な分位数== いくつかの ''q'' に対する ''q'' 分位数には、特別な名称がある。 ===中央値=== {{main|中央値}} 1 / 2 分位数を、中央値、メディアン ({{en|median}})という。中央値は、平均値に代わり、分布を代表する値として使われる。 ===四分位数=== <math>q / 4</math> 分位数を、第 ''q'' 四分位数、第 ''q'' 四分位点、第 ''q'' 四分位値、第 ''q'' ヒンジ ({{en|quartile, hinge}}) という。1 / 4 分位数(第1四分位数)を下側四分位数、3 / 4 分位数(第3四分位数)を上側四分位数ともいう{{sfn|西岡|2013|loc=1.5 分位数|page={{google books quote|id=AUY2AgAAQBAJ|page=12|12}}}}。 単に四分位数といったばあい、第1・第3四分位数を表す。第2四分位数は中央値である。これらは、分布の[[統計的ばらつき]]を表すのに使う。 第1・第3四分位数の差 <math>Q_{3 / 4} - Q_{1 / 4}</math> は、'''四分位範囲'''({{lang-en-short|interquartile range, '''IQR'''}})といい、分布のばらつきの代表値である。分布の代表値として平均値の代わりに中央値を使うときは、IQRを[[標準偏差]]や[[分散 (確率論)|分散]]の代わりに使う。中央値同様、頑強で、[[外れ値]]や極端に広い裾野の影響を受けにくい。 <math>\text{IQR} / 2</math> を'''四分位偏差'''、<math>\text{IQR} / \text{IQR}_{N(0, 1)} \approx 0.7413 ~ \text{IQR}</math> を'''正規四分位範囲'''({{lang-en-short|normalized interquartile range, '''NIQR'''}})といい、IQRの代わりに使うことがある。ここで、<math>\text{IQR}_{N(0, 1)} \approx 1.3490</math> は、標準正規分布のIQRである。[[正規分布]]の正規四分位範囲は、[[標準偏差]]に等しい。なお係数0.7413を[[近似値]]として使うことがある。 四分位数の簡易な求め方として、中央値より上の値の中央値と、中央値より下の値の中央値を使う場合がある。この値を特にヒンジ (hinge) と呼び、それぞれ上側ヒンジ・下側ヒンジ、または、第1・第3ヒンジ(第2ヒンジは中央値)と呼ぶ。ヒンジは、(厳密に計算した)四分位数とは、中央値から離れる方向に少しだけずれる。データ数が多ければずれは小さくなる {{要出典|date=2016年4月}}。 ===三分位数・五分位数・十分位数=== <math>q / 3</math> 分位数を、第 ''q'' 三分位数、第 ''q'' 三分位点、第 ''q'' 三分位値 ({{en|tertile}}) という。 <math>q / 5</math> 分位数を、第 ''q'' 五分位数、第 ''q'' 五分位点、第 ''q'' 五分位値 ({{en|quintile}}) という。 <math>q / 10</math> 分位数を、第 ''q'' 十分位数、第 ''q'' 十分位点、第 ''q'' 十分位値 ({{en|decile}}) という。 ===パーセンタイル=== <math>q / 100</math> 分位数を、''q'' パーセンタイル、(第)''q'' 百分位数、(第)''q'' 百分位点、(第)''q'' 百分位値、''q'' パーセント点、''q'' %点 ({{en|percentile}}) という。 <math>1 - q / 100</math> 分位数を上側 ''q'' パーセント点という。これと対比するときには、<math>q / 100</math> 分位数は下側 ''q'' パーセント点という。また、平均が0の対称分布に対し、<math>1 / 2 + q / 200</math> 分位数を両側 ''q'' パーセント点という。このとき、絶対値が両側 ''q'' パーセント点以内に、分布の ''q'' %が含まれている。 ===最大値・最小値=== 0分位数は最小値、1分位数は最大値である{{sfn|西岡|2013|loc=1.4 度数分布|p={{google books quote|id=AUY2AgAAQBAJ|page=8|8}}}}。最大値と最小値の差は'''範囲'''あるいは'''レンジ'''({{lang-en-short|range}})と呼ばれ、分布のばらつきを表す代表値の一種である。 ==五数要約== {{main|箱ひげ図}} 分布の特徴を最大値、最小値、中央値、上側・下側ヒンジの5つの値、つまり、0, 0.25, 0.5, 0.75, 1分位数で要約することを、五数要約という。五数要約は、しばしば箱ひげ図で図示される。 == 日本産業規格 == [[日本産業規格]]では、分位点を、「<math>p</math>分位点とは,分布関数が <math>p</math> に一致するか,又は<math>p</math>より小さな値から <math>p</math> より大きな値に飛ぶときの確率変数の値。確率<math>p</math> を <math>100p</math>% で表すときは <math>100p</math> パーセント点 ({{en|100''p'' percentile}}) という。備考1. 確率変数のある区間内で分布関数が一定値<math>p</math>となる場合は,その区間内の任意の値が<math>p</math>分位点とされる。ただし,<math>0\leqq p\leqq 1</math>である。 2. <math>p=1/2</math>に対応する確率変数の値をメディアン中央値 ({{en|median}}) という。3. <math>p=1/4</math>および<math>p=3/4</math>に対応する確率変数の値を四分位点 ({{en|quartile}}) という。」と定義している<ref>[[JIS Z 8101]]-1 : 1999 [[統計]] − 用語と記号 − 第1部:[[確率]]及び一般統計用語 1.10 分位点、[[日本規格協会]]、http://kikakurui.com/z8/Z8101-1-1999-01.html</ref>。 == 脚注 == {{脚注ヘルプ}} {{Reflist}} ==参考文献== * {{Cite book|和書|author=西岡康夫|year=2013|series=数学チュートリアル|title=やさしく語る 確率統計|url={{google books|AUY2AgAAQBAJ|plainurl=yes}}|publisher=[[オーム社]]|isbn=978-4-274-21407-3|ref={{sfnref|西岡|2013}}}} == 外部リンク == * [http://jse.amstat.org/v14n3/langford.html Quartiles in Elementary Statistics] 15種類の定義がされている {{統計学}} [[Category:統計量|ふんいすう]] [[Category:数学に関する記事|ふんいすう]]
このページで使用されているテンプレート:
テンプレート:Citation
(
ソースを閲覧
)
テンプレート:Cite book
(
ソースを閲覧
)
テンプレート:En
(
ソースを閲覧
)
テンプレート:Lang-en-short
(
ソースを閲覧
)
テンプレート:Main
(
ソースを閲覧
)
テンプレート:Reflist
(
ソースを閲覧
)
テンプレート:Sfn
(
ソースを閲覧
)
テンプレート:統計学
(
ソースを閲覧
)
テンプレート:脚注ヘルプ
(
ソースを閲覧
)
テンプレート:要出典
(
ソースを閲覧
)
分位数
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報