ディリクレ分布

提供: testwiki
ナビゲーションに移動 検索に移動

テンプレート:確率分布 ディリクレ分布(ディリクレぶんぷ、テンプレート:Lang-en-short)は、連続型確率分布である。ベータ分布を多変量に拡張して一般化した形をしており、そのため多変量ベータ分布とも呼ばれる。ディリクレ分布の確率密度関数は、同時に発生することのない K 個の事象がそれぞれ αi1 回発生したときに、各事象の起こる確率が xi である確率を与える(ただし、αiは整数である必要はない)。つまり、試行の回数が無限大なら各事象の発生の相対頻度は xi になるが、試行回数が有限だと、そこにずれが生じる。そのずれを表すモデルである。

定義と性質

α=(α1,,αK) をパラメータ、実数ベクトル 𝒙=(x1,,xK) を確率変数 とするときのK1次ディリクレ分布の確率密度関数は以下の式で定義される。

P(𝒙;α)=1B(α)i=1Kxiαi1

ここで 𝒙K-1次元単体上の点であり、xi0xi=1を満たす。また、αi>0 であり、B(α) は多変量に拡張したベータ関数で、以下の式で定義される。

B(α)=i=1KΓ(αi)Γ(i=1Kαi)

このとき、xi の期待値は αii=1Kαi、同じく分散は αijiαj(i=1Kαi)2(1+i=1Kαi) である。

確率密度関数の台

ディリクレ分布の確率密度関数のはK次元ベクトルxの集合であって、xの各要素が(0, 1)の開区間に含まれ、かつその要素の合計が1になるようなもの集合である。これは、[0,1]の区間を互いに交わらず大きさが0でないK個の集合に分割していると見ることができる。この他の見方として、ディリクレ分布の定義域それ自体が確率密度関数であるというものがある。すなわち、K個の分割それ自体が離散分布であるとする考え方である。このような台を専門的にはK-1次元単体((K-1)-simplex)と呼ぶ。

特殊な場合

最も単純な特殊例として対称ディリクレ分布が挙げられる。対称ディリクレ分布においては、パラメータベクトルαの要素が全て同じ値である。ここで、パラメータベクトルの要素が全てαであるとすれば、対称ディリクレ分布は次の形で書き表される。

P(𝒙;α)=Γ(αK)Γ(α)Ki=1Kxiα1

仮にα=1であるとすると、ディリクレ分布は(K-1)次元単体上の一様分布になる。

参考文献

  • 蓑谷千凰彦, 統計分布ハンドブック, 朝倉書店 (2003).
  • B. S. Everitt (清水良一訳), 統計科学辞典, 朝倉書店 (2002).

関連項目

外部リンク

テンプレート:確率分布の一覧