指数型分布族

提供: testwiki
ナビゲーションに移動 検索に移動

指数型分布族(しすうがたぶんぷぞく)は、以下のように定義される、特定の形式の確率分布。有用な代数的特性を持つ。

指数型分布族の概念は、1935 – 1936年に[1]、EJG Pitman[2]、G. Darmois[3] 、BO Koopman[4]らによって与えられた。

定義

指数型分布族に属する確率分布の例

指数型分布族には、最も一般的な分布の多くが含まれる。その一部を例示する。 テンプレート:Div col

テンプレート:Div col end

多くの一般的な分布が指数型分布族に属するが、それは特定のパラメーターが既知定数である場合に限られる。例えば:

二項分布
試行回数は固定
多項分布
試行回数は固定
負の二項分布
失敗回数は固定

いずれの場合も、固定する必要のあるパラメーターが観測値のサイズを制限している。

一般的な分布のうち、指数型分布族ではないものとして、 スチューデントの t 分布、ほとんどの混合分布、範囲が固定されていない場合の均一分布が挙げられる。

スカラーパラメータ

単一の実数パラメータに基づく指数型分布族では、 確率密度関数 (離散分布の場合は確率質量関数)が次の形式で表現できる。

fX(xθ)=h(x)exp[η(θ)T(x)A(θ)]

ここで、 T(x)h(x)η(θ)A(θ) はいずれも既知の関数である。

しばしば次のように同等の形式で記述される。

fX(xθ)=h(x)g(θ)exp[η(θ)T(x)]

次のように記述しても同等である。

fX(xθ)=exp[η(θ)T(x)A(θ)+B(x)]

θ は指数型分布族のパラメータと呼ばれる。

η(θ)=θ の場合、指数型分布族は正準型(canonical form)であるという。 変換後のパラメータ η=η(θ) をパラメータとして用いることにより、指数型分布族を正準型に変換することができる。

指数型分布族が正準型であるときのパラメータを自然パラメータ(natural parameter)と呼ぶ。

関連する変数の因数分解

すべての指数型分布族は、単一パラメーターによる指数型分布族の積に分解できる。

ベクトルパラメータ

単一の実数パラメータに基づく指数型分布族を、複数の実数パラメータ(下記ベクトル)に基づく指数型分布族に拡張できる。

θ=(θ1,θ2,,θs).

確率密度関数(または離散分布の場合は確率質量関数)が次のように記述できる場合、ベクトル指数型分布族に属している。

fX(xθ)=h(x)exp(i=1sηi(θ)Ti(x)A(θ))

またはもっとコンパクトな形で

fX(xθ)=h(x)exp(η(θ)𝑻(x)A(θ))

下記のように記載されることも多い。

fX(xθ)=h(x)g(θ)exp(η(θ)𝑻(x))

スカラー値の場合と同様に、ベクトル指数型分布族は次の場合に正準型と呼ばれる。

i:ηi(θi)=θi.

ベクトルパラメータ、ベクトル変数

単一の確率変数に対する指数型分布族は、複数の確率変数に対する指数型分布族に拡張できる。

複数の確率変数を次のように記述すると、

𝐱=(x1,x2,,xk).

指数型分布族の確率分布は次のように記述される。

fX(𝐱θ)=h(𝐱)exp(i=1sηi(θ)Ti(𝐱)A(θ))

またはもっとコンパクトな形で

fX(𝐱θ)=h(𝐱)exp(η(θ)𝑻(𝐱)A(θ))

次のように記述されることも多い。

fX(𝐱θ)=h(𝐱)g(θ)exp(η(θ)𝑻(𝒙))

性質

指数型分布族には、統計分析に非常に役立つ多数の性質がある。 多くの場合、これらの特性を持つのは指数型分布族のみである。 例:

  • 共役事前分布を持つ

正規分布指数分布対数正規分布ガンマ分布カイ二乗分布ベータ分布ディリクレ分布ベルヌーイ分布カテゴリカル分布ポアソン分布幾何分布逆ガウス分布フォン・ミーゼス分布フォンミーゼス-フィッシャー分布はすべて指数型分布族に属する。

正規分布:未知の平均、既知の分散

未知の平均値 μ と既知の分散 σ2 による正規分布を考える。 確率密度関数は

fσ(x;μ)=12πσ2exp((xμ)22σ2).

これは、次のように設定することで、単一パラメーターの指数型分布族であることが分かる。

hσ(x)=12πσ2exp(x22σ2)Tσ(x)=xσAσ(μ)=μ22σ2ησ(μ)=μσ.

σ2=1、すなわち ησ(μ)=μ の場合、これは正準型となる。

正規分布:未知の平均と分散

未知の平均 μ と未知の分散 σ2 を持つ正規分布の場合を考える。 確率密度関数は

f(x;μ,σ)=12πσ2exp((xμ)22σ2).

これは、次のように設定することで、指数型分布族であることが分かる。

η=(μσ2,12σ2)Th(x)=12πT(x)=(x,x2)TA(η)=μ22σ2+log|σ|=η124η2+12log|12η2|

二項分布:既知の試行回数

離散変数を対象とする指数型分布族の例として、試行回数 n が既知の二項分布を考える。

この分布の確率質量関数

f(x)=(nx)px(1p)nx,x{0,1,2,,n}.

これは同等に次のように書くことができる。

f(x)=(nx)exp(xlog(p1p)+nlog(1p)),x{0,1,2,,n}.

二項分布は指数型分布族であり、その自然パラメーター η

η=logp1p.

となる。 この p の関数はロジットと呼ばれる。

分布表

次の表は、多くの一般的な分布を、正準型の指数型分布族として書き換える方法を示している[5]

スカラー変数とスカラーパラメータの場合:

fX(xθ)=h(x)exp(η(θ)T(x)A(η))

スカラー変数とベクトルパラメータの場合:

fX(xθ)=h(x)exp(η(θ)𝑻(x)A(η))
fX(xθ)=h(x)g(θ)exp(η(θ)𝑻(x))

ベクトル変数とベクトルパラメータの場合:

fX(𝐱θ)=h(𝐱)exp(η(θ)𝑻(𝒙)A(η))
確率分布 パラメータ θ 自然パラメータ η パラメータの逆写像 Base measure h(x) 十分統計量 T(x) Log-partition A(η) Log-partition A(θ)
ベルヌーイ分布[注釈 1] p logp1p 11+eη=eη1+eη 1 x log(1+eη) log(1p)
二項分布
既知の試行回数 n
p logp1p 11+eη=eη1+eη (nx) x nlog(1+eη) nlog(1p)
ポアソン分布 λ logλ eη 1x! x eη λ
負の二項分布
with known number of failures r
p logp eη (x+r1x) x rlog(1eη) rlog(1p)
指数分布 λ λ η 1 x log(η) logλ
パレート分布
with known minimum value xm
α α1 1η 1 logx log(1η)+(1+η)logxm logααlogxm
ワイブル分布
with known shape k
λ 1λk (η)1k xk1 xk log(η)logk klogλlogk
ラプラス分布
既知の平均 μ
b 1b 1η 1 |xμ| log(2η) log2b
カイ二乗分布 ν ν21 2(η+1) ex2 logx logΓ(η+1)+(η+1)log2 logΓ(ν2)+ν2log2
正規分布
既知の分散 σ2
μ μσ ση ex22σ22πσ xσ η22 μ22σ2
正規分布 μ, σ2 [μσ212σ2] [η12η212η2] 12π [xx2] η124η212log(2η2) μ22σ2+logσ
対数正規分布 μ, σ2 [μσ212σ2] [η12η212η2] 12πx [logx(logx)2] η124η212log(2η2) μ22σ2+logσ
逆ガウス分布 μ, λ [λ2μ2λ2] [η2η12η2] 12πx32 [x1x] 2η1η212log(2η2) λμ12logλ
ガンマ分布 α, β [α1β] [η1+1η2] 1 [logxx] logΓ(η1+1)(η1+1)log(η2) logΓ(α)αlogβ
k, θ [k11θ] [η1+11η2] logΓ(k)+klogθ
逆ガンマ分布 α, β [α1β] [η11η2] 1 [logx1x] logΓ(η11)(η11)log(η2) logΓ(α)αlogβ
一般化逆ガウス分布 p, a, b [p1a/2b/2] [η1+12η22η3] 1 [logxx1x] log2Kη1+1(4η2η3)η1+12logη2η3 log2Kp(ab)p2logab
スケールされた逆カイ二乗分布 ν, σ2 [ν21νσ22] [2(η1+1)η2η1+1] 1 [logx1x] logΓ(η11)(η11)log(η2) logΓ(ν2)ν2logνσ22
ベータ分布 (variant 1) α, β [αβ] [η1η2] 1x(1x) [logxlog(1x)] logΓ(η1)+logΓ(η2)logΓ(η1+η2) logΓ(α)+logΓ(β)logΓ(α+β)
ベータ分布 (variant 2) α, β [α1β1] [η1+1η2+1] 1 [logxlog(1x)] logΓ(η1+1)+logΓ(η2+1)logΓ(η1+η2+2) logΓ(α)+logΓ(β)logΓ(α+β)
多変量正規分布 μ, σ [Σ1μ12Σ1] [12η21η112η21] (2π)k2 [𝐱𝐱𝐱T] 14η1Tη21η112log|2η2| 12μTΣ1μ+12log|Σ|
カテゴリカル分布 (variant 1)[注釈 2] p1,,pk

where i=1kpi=1
[logp1logpk] [eη1eηk]

where i=1keηi=1
1 [[x=1][x=k]] 0 0
カテゴリカル分布 (variant 2)[注釈 2] p1,,pk

where i=1kpi=1
[logp1+Clogpk+C] [1Ceη11Ceηk]=

[eη1i=1keηieηki=1keηi] where i=1keηi=C

1 [[x=1][x=k]] 0 0
カテゴリカル分布 (variant 3)[注釈 2] p1,,pk

where pk=1i=1k1pi
[logp1pklogpk1pk0]=

[logp11i=1k1pilogpk11i=1k1pi0]
[eη1i=1keηieηki=1keηi]=

[eη11+i=1k1eηieηk11+i=1k1eηi11+i=1k1eηi]

1 [[x=1][x=k]] log(i=1keηi)=log(1+i=1k1eηi) logpk=log(1i=1k1pi)
多項分布 (variant 1)
既知の試行回数 n
p1,,pk

where i=1kpi=1
[logp1logpk] [eη1eηk]

where i=1keηi=1
n!i=1kxi! [x1xk] 0 0
多項分布 (variant 2)
既知の試行回数 n
p1,,pk

where i=1kpi=1
[logp1+Clogpk+C] [1Ceη11Ceηk]=

[eη1i=1keηieηki=1keηi]

where i=1keηi=C

n!i=1kxi! [x1xk] 0 0
多項分布 (variant 3)
既知の試行回数 n
p1,,pk

where pk=1i=1k1pi
[logp1pklogpk1pk0]=

[logp11i=1k1pilogpk11i=1k1pi0]
[eη1i=1keηieηki=1keηi]=

[eη11+i=1k1eηieηk11+i=1k1eηi11+i=1k1eηi]

n!i=1kxi! [x1xk] nlog(i=1keηi)=nlog(1+i=1k1eηi) nlogpk=nlog(1i=1k1pi)
ディリクレ分布 (variant 1) α1,,αk [α1αk] [η1ηk] 1i=1kxi [logx1logxk] i=1klogΓ(ηi)logΓ(i=1kηi) i=1klogΓ(αi)logΓ(i=1kαi)
ディリクレ分布 (variant 2) α1,,αk [α11αk1] [η1+1ηk+1] 1 [logx1logxk] i=1klogΓ(ηi+1)logΓ(i=1k(ηi+1)) i=1klogΓ(αi)logΓ(i=1kαi)
ウィッシャート分布[注釈 3] 𝐕, n [12𝐕1np12] [12η112η2+p+1] 1 [𝐗log|𝐗|] (η2+p+12)log|η1|
      +logΓp(η2+p+12)=
n2log|η1|+logΓp(n2)=
(η2+p+12)(plog2+log|𝐕|)
      +logΓp(η2+p+12)
  • Three variants with different parameterizations are given, to facilitate computing moments of the sufficient statistics.
n2(plog2+log|𝐕|)+logΓp(n2)
逆ウィッシャート分布 Ψ, m [12Ψm+p+12] [2η1(2η2+p+1)] 1 [𝐗1log|𝐗|] (η2+p+12)log|η1|+logΓp((η2+p+12))=m2log|η1|+logΓp(m2)=(η2+p+12)(plog2log|Ψ|)+logΓp((η2+p+12)) m2(plog2log|Ψ|)+logΓp(m2)
ガウス・ガンマ分布 α, β, μ, λ [α12βλμ22λμλ2] [η1+12η2+η324η4η32η42η4] 12π [logτττxτx2] logΓ(η1+12)12log(2η4)

      (η1+12)log(η2+η324η4)

logΓ(α)αlogβ12logλ

統計における役割

指数型分布族は、 一般化線形モデルで使用される分布関数の基礎を形成する。 一般化線形モデルは、統計で一般的に使用される回帰モデルの多くを含む。

脚注

注釈

テンプレート:Reflist

出典

テンプレート:Reflist

参考文献

外部リンク


引用エラー: 「注釈」という名前のグループの <ref> タグがありますが、対応する <references group="注釈"/> タグが見つかりません