離散一様分布

テンプレート:確率分布 離散一様分布（りさんいちようぶんぷ、テンプレート:Lang-en-short）は、確率論や統計学における離散確率分布の一種であり、有限集合の全ての値について、等しく確からしい場合である。

確率変数がテンプレート:Mvar 個の値テンプレート:Math2 を同じ確率でとりうるとき、離散一様分布と言える。任意のテンプレート:Mvar の確率はテンプレート:Math である。離散一様分布の単純な例としてサイコロがある。その場合のテンプレート:Mvar がとりうる値は 1, 2, 3, 4, 5, 6 で、1回サイコロを振ったとき、それぞれの値が出る確率はテンプレート:Math である。2個のサイコロを振って和をとると、もはや一様分布ではなくなり、とりうる値（2 から 12）によって確率が変わってくる。

離散一様分布の確率変数がとりうる値が実数の場合、累積分布関数を退化分布を使って表すことができる。すなわち、

F (k; a, b, n) = \frac{1}{n} \sum_{i = 1}^{n} H (k - k_{i})

ここで、ヘヴィサイドの階段関数 $H (x - x_{0})$ は、テンプレート:Math を中心とする退化分布の累積分布関数である。この式は、各転移点で一貫した規定が使われると想定している。

非復元抽出による最大値の推定

整数テンプレート:Math2 からテンプレート:Mvar 個の標本が非復元抽出され、離散一様分布と同様に、標本の抽出のされ方に整数による差はないとする。ここで未知の最大値テンプレート:Mvar を推定する問題が生じる。このような問題を一般に German tank problem（ドイツ戦車問題）と呼び、第二次世界大戦中のドイツでの戦車生産数の最大値を推定するという問題に由来する。

最大値のUMVU推定によると、次のようになる。

\hat{N} = \frac{k + 1}{k} m - 1 = m + \frac{m}{k} - 1

ここでテンプレート:Mvar は標本内の最大値、テンプレート:Mvar は標本数である^[1]^[2]。これは maximum spacing estimation の非常に単純な例と見ることもできる。

この式は直観的に次のように理解できる。

「標本の最大値に観測された標本値の平均間隔を加える」

この間隔は標本の最大値の負のバイアスを補填するよう加算され、母集団の最大値の推定とする^{[notes 1]}。

この分散は次のようになる^[1]。

\frac{1}{k} \frac{(N - k) (N + 1)}{(k + 2)} \approx \frac{N^{2}}{k^{2}} for small samples k ≪ N

つまり標準偏差は約テンプレート:Math で（母集団の）標本間の間隔の平均であり、上のテンプレート:Math に似ている。

標本の最大値は母集団の最大値の最尤推定量だが、これまで述べたようにバイアスがかかっている。

標本が数として捉えられず、単に識別可能あるいは標識を付与できるなら、母集団の大きさの推定を標識再捕獲法で行うことができる。

脚注

テンプレート:Reflist

出典

テンプレート:Reflist

テンプレート:確率分布の一覧

引用エラー: 「notes」という名前のグループの <ref> タグがありますが、対応する <references group="notes"/> タグが見つかりません

[Johnson-1] 1.0 ^1.1 テンプレート:Citation

[Johnson2-2] テンプレート:Citation

[1]

[2]

[notes 1]

離散一様分布

目次

非復元抽出による最大値の推定

関連項目

脚注

出典

ナビゲーションメニュー

離散一様分布

非復元抽出による最大値の推定

関連項目

脚注

出典

ナビゲーション メニュー

検索

ナビゲーションメニュー