ワッサースタイン計量

提供: testwiki
ナビゲーションに移動 検索に移動

ワッサースタイン計量(ワッサースタインけいりょう、テンプレート:Lang-en-short)とは、与えられた距離空間 M上の確率分布の間に定義される距離函数である。

直感的な説明としては、各分布をM上に堆積した土の単位量と見なすとき、ワッサースタイン計量とは一つの堆積を別の物へと移すときにかかる最小のコストである。そのようなコストは、移されるべき土の量に移す距離を掛けた値であるとされる。このアナロジーに従い、この計量は計算機科学の分野においてテンプレート:仮リンク(earth mover's distance)として知られている。

「ワッサースタイン計量」という名前は、この概念を1969年に導入したロシア数学者テンプレート:仮リンクの名にちなみ、1970年にテンプレート:仮リンクによって付けられた。多くの英語の出版物においてはドイツ語のスペル "Wasserstein" が用いられている(これは、"Vasershtein" という名がドイツに起源を持つことに起因している)。

定義

(Md) を、M上のすべての確率測度がラドン測度であるような距離空間(いわゆるラドン空間)とする。p ≥ 1 に対し、有限p次モーメントを備えるM上のすべての確率測度μの系を Pp(M) で表す。すなわち、そのようなμM内のあるx0 に対して

Md(x,x0)pdμ(x)<+

を満たすようなものである。このとき、Pp(M) に含まれる二つの確率測度μνの間のワッサースタイン計量(ワッサースタイン距離)は、

Wp(μ,ν):=(infγΓ(μ,ν)M×Md(x,y)pdγ(x,y))1/p

で定義される。ここで Γ(μν) は第一変数と第二変数にそれぞれ周辺分布μνを備えるM × M上のすべての測度の系を表す。集合 Γ(μν) はμνのすべてのカップリングからなる集合とも呼ばれる。

上述の距離は通常 Wp(μν) ("Wasserstein"という綴りより)、あるいは ℓp(μν) ("Vasershtein"という綴りより)の記号によって表される。この記事の残りの部分ではWpを使用する。

ワッサースタイン計量には、次のような同値な定義も存在する。

Wp(μ,ν)p=inf𝐄[d(X,Y)p].

ここで E[Z] は確率変数Z期待値を表し、下限はそれぞれ周辺分布μνを備える確率変数XYのすべての結合分布に対して取られる。

応用

ワッサースタイン計量は、一つの変数がもう一方の(確率論的あるいは決定論的に)非一様な小さい摂動によって得られるような、二つの変数 XY の確率分布を比較する際に自然に用いられる。

例えば計算機科学の分野においては、二つのデジタル画像テンプレート:仮リンクといった離散分布を比較する際に、ワッサースタイン計量 W1 が広く用いられている。詳細についてはテンプレート:仮リンクを参照されたい。

性質

距離構造

Wp は、Pp(M) 上の距離公理をすべて満たすことが示される。さらに、Wp についての収束は、通常のテンプレート:仮リンクに初めの p 次モーメント収束を加えたものと同値である。

W1 の双対表現

次に挙げる W1 の双対表現は、カントロヴィチとルビンスタインの双対定理(1958年)の特別な場合である:μν有界を持つとき、

W1(μ,ν)=sup{Mf(x)d(μν)(x)|continuous f:M,Lip(f)1}

が成立する。ここで Lip(f) は f に関する最小のリプシッツ定数を表す。

これを、ラドン計量の定義と比較する:

ρ(μ,ν):=sup{Mf(x)d(μν)(x)|continuous f:M[1,1]}.

もし計量 d がある定数 C によって抑えられているなら、

2W1(μ,ν)Cρ(μ,ν)

が得られる。したがって、ラドン計量における収束(Mポーランド空間であるときの全変動収束に等しい)は、ワッサースタイン計量における収束を意味する。しかしその逆は一般には成り立たない。

可分性と完備性

任意の p ≥ 1 に対し、計量空間 (Pp(M), Wp) が可分および完備であるための十分条件は、(M, d) が可分および完備であることである。

関連項目

参考文献