連続一様分布
テンプレート:出典の明記 テンプレート:確率分布 連続一様分布(テンプレート:Lang-en-short)は、確率論や統計学における連続確率分布の一種であり、分布上の同じ長さの区間が等しく確からしい場合である。台は2つの母数 テンプレート:Mvar と テンプレート:Mvar で定義され、それぞれ最小値と最大値である。この分布を テンプレート:Math と略記することが多い。
無限型確率変数の中で、等確率空間である(つまり、根元事象全体が同様に確からしい)唯一の場合である。
特性
確率密度関数
連続一様分布の確率密度関数は次の通りである。
2つの境界 テンプレート:Mvar と テンプレート:Mvar での値は、テンプレート:Math の任意の区間での積分に影響を与えないし、テンプレート:Math の積分にも影響を与えないため、通常あまり重視されない。したがって、テンプレート:Math とする場合もあるし、テンプレート:Math とする場合もある。後者は最尤法による推定の場合によく見られる。フーリエ解析においては、テンプレート:Math や テンプレート:Math の値を テンプレート:Math とすることもある。そうすると、この一様関数の積分変換の逆変換は元の関数自身に戻る。さもないと「ほとんど至るところで」等しい関数に戻る。すなわち、零集合以外で等しい関数になる。また、このような曖昧さのない符号関数の定義とも一貫する。
累積分布関数
累積分布関数は次の通りである。
母関数
積率母関数
積率母関数は次の通りである。
ここから積率 テンプレート:Mvar を計算することができる。
この分布に従う確率変数では、期待値は テンプレート:Math2 となり、分散は となる。
キュムラント母関数
テンプレート:Math2 のとき、区間 テンプレート:Math 上の一様分布の テンプレート:Mvar 番目のキュムラントは であり、ここで テンプレート:Mvar は テンプレート:Mvar 番目のベルヌーイ数である。
属性
ボレル集合への一般化
この分布は区間よりも複雑な集合に一般化することができる。テンプレート:Mvar を正の有限測度のボレル集合としたとき、テンプレート:Mvar 上の一様分布の確率密度関数は、テンプレート:Mvar の範囲外ではゼロで テンプレート:Mvar 上では テンプレート:Math という一定の値をとる。ここで テンプレート:Mvar は テンプレート:Mvar のルベーグ測度である。
順序統計量
テンプレート:Math2 が テンプレート:Math からの独立同分布 (i.i.d.) の標本とする。テンプレート:Math がこの標本における k番目の順序統計量とする。すると、テンプレート:Math の確率分布は テンプレート:Mvar と テンプレート:Math を母数とするベータ分布である。期待値は次のようになる。
このことは、Q-Qプロットを作成する際に便利である。 分散は次のようになる。
一様性
一様分布する確率変数の任意の固定長の区間での確率は、その区間が分布の台に含まれる限りにおいて、その区間自体の位置とは独立である(ただし、区間の長さには依存する)。
これを示すため、テンプレート:Math2 で テンプレート:Math が テンプレート:Math の部分区間であり、定数 テンプレート:Math2 とすると、
となり、テンプレート:Mvar とは独立となる。この事実から「一様」分布と名付けられた。
標準一様
テンプレート:Math2 かつ テンプレート:Math2 に限定したときの分布 テンプレート:Math を標準一様分布 (standard uniform distribution) と呼ぶ。
標準一様分布の興味深い属性として、テンプレート:Math が標準一様分布を持つなら、テンプレート:Math も同様である。この属性は、対照変量法など様々な分野で利用されている。
関連する分布
- テンプレート:Mvar が標準一様分布であるとき、逆関数法により、テンプレート:Math2 はパラメータ テンプレート:Mvar の指数分布となる。
- はパラメータが テンプレート:Math と テンプレート:Mvar のベータ分布である。なお、このことは、標準一様分布がパラメータ テンプレート:Math と テンプレート:Math のベータ分布の特殊ケースであることを意味する。
- 2つの独立同分布の一様分布の総和は対称な三角分布となる。
- 一様分布に従う独立な確率変数の和はテンプレート:Illに従う。
他の関数との関係
遷移点の扱いが同じであれば、連続一様分布の確率密度関数はヘヴィサイドの階段関数を使って次のように表すこともできる。
あるいは、矩形関数を使って次のように表すこともできる。
符号関数の遷移点の解釈には曖昧さがない。遷移点が符号関数と同じく半分の値をとるとした場合、一様分布は符号関数を使って次のように表せる。
応用
統計学において、単純な帰無仮説の検定統計量としてp値を使う場合、検定統計量の分布が連続なら、帰無仮説が真のとき検定統計量(p値)は0と1の間で一様分布する。
一様分布からの標本化
シミュレーション実験には多くの有益な応用がある。多くのプログラミング言語には擬似乱数列を生成する機能があり、事実上それらは標準一様分布に従って分布している。
標準一様分布からの標本値 テンプレート:Mvar があるとき、テンプレート:Math という値は上述の通り母数 テンプレート:Mvar と テンプレート:Mvar の一様分布に従った値となる。
任意の分布からの標本化
一様分布は任意の分布からの標本化にも有効である。汎用的手法として逆関数法があり、対象とする確率変数の累積分布関数を使う。理論的研究では非常に便利な手法である。シミュレーションでこの手法を使う場合、対象とする変数のCDFを知っている必要があるため、閉形式のCDFが未知の場合について代替手法が生み出されてきた。例えば、棄却サンプリング法がある。
正規分布は、逆関数法が効果的でない重要な例である。しかしボックス-ミューラー変換という正確な手法があり、2つの独立で一様な確率変数を独立な正規分布の確率変数に変えるため、逆変換を使う。
推定
最大値の推定
区間 テンプレート:Math 上の一様分布について、テンプレート:Mvar が未知の場合、最大値のUMVU推定は次のようになる。
ここで テンプレート:Mvar は標本の最大値、テンプレート:Mvar は標本の大きさ(数)であり、標本の順序は入れ替えない(ただし、連続分布ではこの限定はほとんど意味を持たない)。これは離散分布での推定と同じ理由で、maximum spacing estimation の非常に単純な例と見ることができる。このような問題を一般に German tank problem(ドイツ戦車問題)と呼び、第二次世界大戦中のドイツでの戦車生産数の最大値を推定するという問題に由来する。
中点の推定
分布の中点 テンプレート:Math は、一様分布の期待値であり中央値である。標本の平均値と標本の中央値は母集団の中点のバイアスのない推定値だが、どちらも標本の範囲中央(標本の最大値と最小値の平均)ほど効率的ではない。それが中点のUMVU推定である(また、最尤推定値である)。