離散一様分布
テンプレート:確率分布 離散一様分布(りさんいちようぶんぷ、テンプレート:Lang-en-short)は、確率論や統計学における離散確率分布の一種であり、有限集合の全ての値について、等しく確からしい場合である。
確率変数が テンプレート:Mvar 個の値 テンプレート:Math2 を同じ確率でとりうるとき、離散一様分布と言える。任意の テンプレート:Mvar の確率は テンプレート:Math である。離散一様分布の単純な例としてサイコロがある。その場合の テンプレート:Mvar がとりうる値は 1, 2, 3, 4, 5, 6 で、1回サイコロを振ったとき、それぞれの値が出る確率は テンプレート:Math である。2個のサイコロを振って和をとると、もはや一様分布ではなくなり、とりうる値(2 から 12)によって確率が変わってくる。
離散一様分布の確率変数がとりうる値が実数の場合、累積分布関数を退化分布を使って表すことができる。すなわち、
ここで、ヘヴィサイドの階段関数 は、テンプレート:Math を中心とする退化分布の累積分布関数である。この式は、各転移点で一貫した規定が使われると想定している。
非復元抽出による最大値の推定
整数 テンプレート:Math2 から テンプレート:Mvar 個の標本が非復元抽出され、離散一様分布と同様に、標本の抽出のされ方に整数による差はないとする。ここで未知の最大値 テンプレート:Mvar を推定する問題が生じる。このような問題を一般に German tank problem(ドイツ戦車問題)と呼び、第二次世界大戦中のドイツでの戦車生産数の最大値を推定するという問題に由来する。
最大値のUMVU推定によると、次のようになる。
ここで テンプレート:Mvar は標本内の最大値、テンプレート:Mvar は標本数である[1][2]。これは maximum spacing estimation の非常に単純な例と見ることもできる。
この式は直観的に次のように理解できる。
- 「標本の最大値に観測された標本値の平均間隔を加える」
この間隔は標本の最大値の負のバイアスを補填するよう加算され、母集団の最大値の推定とする[notes 1]。
この分散は次のようになる[1]。
つまり標準偏差は約 テンプレート:Math で(母集団の)標本間の間隔の平均であり、上の テンプレート:Math に似ている。
標本の最大値は母集団の最大値の最尤推定量だが、これまで述べたようにバイアスがかかっている。
標本が数として捉えられず、単に識別可能あるいは標識を付与できるなら、母集団の大きさの推定を標識再捕獲法で行うことができる。
関連項目
- ディラックのデルタ関数
- 連続一様分布
- テンプレート:Ill2 - 第二次世界大戦中にドイツ側の戦車の生産台数を計算から割り出していた。
脚注
出典
引用エラー: 「notes」という名前のグループの <ref> タグがありますが、対応する <references group="notes"/> タグが見つかりません