クーポンコレクター問題

クーポンコレクター問題（クーポンコレクターもんだい、テンプレート:Lang-en）とは、確率論における「全てのクーポンを集めると何らかの特典が得られる」場合に、何回クーポンを引けばよいかという問題である。「クーポンコレクター」と表現しているが、ソーシャルゲームで問題視されたコンプリートガチャをはじめ、トレーディングカード、カプセルトイ、ブラインドパッケージの食玩などで全種類を集める（コンプリートする）場合にも適用できる問題である。そのため、日本においては「食玩問題 」^[1]とも呼ばれる。

具体的には次のような問題である。

壺の中に n 種類の異なるクーポンが入っている。1回の試行で壺の中から1枚クーポンを引き、引いたものと同じ種類のクーポンを壺の中に戻すものとする。n 種類（全種類）のクーポンを集めようとしたとき、 t 回以上の試行回数が必要となる確率はいくつだろうか?

別の言い方をすると次のようになる。

n 種類の異なるクーポンがあるとき、各種類のクーポンを1回以上引くまでに、何回クーポンを引けば良いか?

数学的分析によれば、必要とされる試行回数の期待値は $Θ (n \log (n))$ である^{[注釈 1]}。例えば n = 50の場合、全50種類のクーポンを収集するには、平均で約225回の試行が必要となる^{[注釈 2]}。

解法

期待値の計算

T を全 n 種のクーポンを収集する時間とし、 t_i を i - 1種のクーポンを収集した後に i 種類目のクーポンを収集する時間とする。T と t_i を確率変数と考える。新しいクーポンを集める確率は p_i = (n − (i − 1))/n である。従って、 t_i は期待値を1/p_i とする幾何分布となる。期待値の線形性により、以下が得られる。

\begin{matrix} E (T) & = E (t_{1}) + E (t_{2}) + \dots + E (t_{n}) = \frac{1}{p_{1}} + \frac{1}{p_{2}} + \dots + \frac{1}{p_{n}} \\ = \frac{n}{n} + \frac{n}{n - 1} + \dots + \frac{n}{1} \\ = n \cdot (\frac{1}{1} + \frac{1}{2} + \dots + \frac{1}{n}) \\ = n \cdot H_{n} \end{matrix}

ここで、 H_n は n 番目の調和数である。調和数のテンプレート:仮リンクを使用して、以下が得られる。

E (T) = n \cdot H_{n} = n \log n + γ n + \frac{1}{2} + O (1 / n)

ここで、 $γ \approx 0.5772156649$ はオイラーの定数である。

マルコフの不等式を使用して、所望の確率の上限を与えることができる。

P (T \geq c n H_{n}) \leq \frac{1}{c}

分散の計算

確率変数 t_i の独立性を用いて、分散が以下のように計算できる。

\begin{matrix} Var (T) & = Var (t_{1}) + Var (t_{2}) + \dots + Var (t_{n}) \\ = \frac{1 - p_{1}}{p_{1}^{2}} + \frac{1 - p_{2}}{p_{2}^{2}} + \dots + \frac{1 - p_{n}}{p_{n}^{2}} \\ < (\frac{n^{2}}{n^{2}} + \frac{n^{2}}{(n - 1)^{2}} + \dots + \frac{n^{2}}{1^{2}}) \\ = n^{2} \cdot (\frac{1}{1^{2}} + \frac{1}{2^{2}} + \dots + \frac{1}{n^{2}}) \\ < \frac{π^{2}}{6} n^{2} \end{matrix}

なぜならば、 $\frac{π^{2}}{6} = \frac{1}{1^{2}} + \frac{1}{2^{2}} + \dots + \frac{1}{n^{2}} + \dots$ であるからである（バーゼル問題を参照）。

チェビシェフの不等式を使用して、所望の確率を決めることができる。

P (| T - n H_{n} | \geq c n) \leq \frac{π^{2}}{6 c^{2}}

テールの推定

異なる上限は、以下の計算から導き出すことができる。 $Z_{i}^{r}$ を最初の $r$ 回の試行で $i$ 番目のクーポンが引けない事象を表すとする。

\begin{matrix} P [Z_{i}^{r}] = {(1 - \frac{1}{n})}^{r} \leq e^{- r / n} \end{matrix}

したがって、 $r = β n \log n$ については $P [Z_{i}^{r}] \leq e^{(- β n \log n) / n} = n^{- β}$ となる。

\begin{matrix} P [T > β n \log n] = P [⋃_{i} Z_{i}^{β n \log n}] \leq n \cdot P [Z_{1}^{β n \log n}] \leq n^{- β + 1} \end{matrix}

拡張と一般化

ポール・エルデシュとレーニ・アルフレードは、 T の分布の極限定理を証明した。この結果は、ここまでに述べた境界のさらなる拡張である。

P (T < n \log n + c n) \to e^{- e^{- c}} (n \to \infty)

テンプレート:仮リンクとテンプレート:仮リンクは、全クーポンを m 枚ずつ収集する必要がある場合として、クーポンコレクター問題を一般化した。各クーポンを m 枚収集するのにかかる時間を T_m とする。彼らは、この場合の期待値が以下を満たしていることを示した。

E (T_{m}) = n \log n + (m - 1) n \log \log n + O (n) (n \to \infty)

ここで、 m は固定されている。 m = 1のとき、上述の式が得られる。

同じ一般化のもとでエルデシュとレーニは以下を導いた。

P (T_{m} < n \log n + (m - 1) n \log \log n + c n) \to e^{- e^{- c} / (m - 1)!} (n \to \infty)

テンプレート:仮リンク^[2]によると、不均一な確率分布の一般的なケースでは、以下のようになる。

E (T) = \int_{0}^{\infty} (1 - \prod_{i = 1}^{n} (1 - e^{- p_{i} t})) d t

脚注

注釈

テンプレート:Notelist

出典

テンプレート:Reflist

出典

外部リンク

"Coupon Collector Problem" by Ed Pegg, Jr., the Wolfram Demonstrations Project. Mathematica package.
How Many Singles, Doubles, Triples, Etc., Should The Coupon Collector Expect?, a short note by Doron Zeilberger.

テンプレート:確率論

引用エラー: 「注釈」という名前のグループの <ref> タグがありますが、対応する <references group="注釈"/> タグが見つかりません

[1] テンプレート:Cite web

[Flajolet-4] テンプレート:Citation

[1]

[注釈 1]

[注釈 2]

[2]

クーポンコレクター問題

目次

解法

期待値の計算

分散の計算

テールの推定

拡張と一般化

関連項目

脚注

注釈

出典

出典

外部リンク

ナビゲーションメニュー

クーポンコレクター問題

解法

期待値の計算

分散の計算

テールの推定

拡張と一般化

関連項目

脚注

注釈

出典

出典

外部リンク

ナビゲーション メニュー

検索

ナビゲーションメニュー