再生核ヒルベルト空間

提供: testwiki
ナビゲーションに移動 検索に移動
関連した異なるRKHSの見方を表した図

関数解析学数学の一分野)において、再生核ヒルベルト空間RKHS)(さいせいかくヒルベルトくうかん、: reproducing kernel hilbert space)は、点評価が連続線形汎函数であるような関数から成るヒルベルト空間である。点評価が連続線形であるとは、大雑把に言えば、RKHSに属する関数fgがノルムとして近い(fgが小さい)とき、fgは各点でも近い(|f(x)g(x)|が任意のxで小さい)ということである。逆は必ずしも成り立つ必要は無い。例えば、ノルムを一様ノルムとしたとき関数列sinn(x)各点収束するが一様収束しない。(ただし、一様ノルムは極化恒等式を満たさないためにいかなる内積からも誘導されないから、これは反例ではない。)

関数のヒルベルト空間であってRKHSでないものを作るのは簡単ではない。[1]しかし、いくつかの例は見つかっている。[2][3]

L2 空間は関数のヒルベルト空間ではない(したがってRKHSではない)が、関数の同値類のヒルベルト空間ではある(例えば、f(x)=0g(x)=1で定義されたfgL2では同値である)。一方、 L2ノルムがノルムであるようなRKHSは存在する。例として、帯域制限関数の空間がある(詳細は後)。

RKHSは、その中の任意の関数を再生するような核と関係している。関数を「再生する」とは、関数の定義域内の任意のxに対して、その関数の「xでの評価」が、核から生成される関数との内積をとることで可能である、ということである。そのような再生核は、評価関数が全て連続である時かつその時に限って存在する。

再生核が最初に提唱されたのは調和関数重調和方程式境界値問題に関するStanislaw Zarembaの1907年の研究である。同時期に、James Mercerは積分方程式の理論における再生性を満たすような関数を研究した。その後再生核のアイデアは20年近く放置されたが、セゲー・ガーボルテンプレート:仮リンクサロモン・ボホナーによる論文で再び触れられるようになった。その後1950年代前半にナフマン・アロンシャインとステファン・ベルグマンがこのテーマを体系的に発展させた。[4]

再生核ヒルベルト空間には、複素解析調和解析量子力学など様々な応用がある。その中でも特に、RKHS内で経験損失を最小化するような関数は訓練データで評価された核関数の線形結合で書けるというテンプレート:仮リンクのおかげで、テンプレート:仮リンクの分野で再生核ヒルベルト空間が重要である。これは、経験損失最小化問題を無限次元の最適化問題から有限次元最適化問題へ簡単かできるために、実用上有用な結果である。

簡単のため、ここでは実数値ヒルベルト空間の概要を説明する。この理論は簡単に複素数値関数に拡張することができ、したがって解析関数空間であるような再生核ヒルベルト空間の重要な例を多く含んでいる。[5]

定義

X集合とし、Hを、X上で各点での加算とスカラー倍が定義された実数値関数から成るヒルベルト空間とする。ヒルベルト空間Hでの評価汎関数とは、点xXについて、関数を受け取って

Lx:ff(x) fH

と評価する線形汎関数である。H再生核ヒルベルト空間であるとは、任意のxXについて、LxH上の任意のfで連続であることである。同値な条件は、LxH上の有界作用素である、つまり

テンプレート:NumBlk

を満たすMx>0が存在することである。任意のxXについてMx<でなければならないが、supxMx=でも良い。

性質 (テンプレート:EquationNote) は、内積が存在し、かつ定義域の任意の点でHの任意の関数を評価できるための最も弱い条件であるが、このままでは応用に使いづらい。性質 (テンプレート:EquationNote) から、H上の関数fの評価汎関数が、fとある関数Kxの内積で得られることが導かれ、こちらをRKHSの定義とする方が直感的である。この関数Kx再生核テンプレート:要出典 と呼ばれる。RKHSはこの「再生核」から名前が来ている。正確には、リースの表現定理から、Xの任意の点xに対して、Hのただ1つの要素Kxが存在して、再生性

テンプレート:NumBlk

が成り立つ。KxXから(複素ヒルベルト空間なら)への関数であり、Hの要素であるから、

Kx(y)=Ly(Kx)=Kx, KyH,

が成り立つ。ただし、KyHLyを生むようなHの元である。

これによって、Hの再生核が以下の関数K:X×Xとして定義できる。

K(x,y)=Kx, KyH.

定義から、K:X×X(複素なら)は対称(複素なら共役対称)であり、正定値でもある、つまり

i,j=1ncicjK(xi,xj)=i=1nciKxi,j=1ncjKxjH=i=1nciKxi,j=1ncjKxjH=i=1nciKxiH20

が任意のn,x1,,xnX, and c1,,cn.で成り立つ。[6]Moore–Aronszajnの定理 (下に説明あり) は、ある種これの逆であり、関数Kがこれらの条件を満たすならば、Kが再生核であるようなX上の関数のヒルベルト空間が存在する、という主張である。

テンプレート:仮リンク連続関数の集合HはRKHSであることを以下に示す。遮断周波数として定数 0<a<をとり、ヒルベルト空間を以下のように定義する。

H={fC()supp(F)[a,a]}

ただし、C()は自乗可積分な連続関数の集合であり、F(ω)=f(t)eiωtdtfフーリエ変換である。ヒルベルト空間の内積として、

f,gL2=f(x)g(x)dx.

と定義する。フーリエ逆変換から

f(x)=12πaaF(ω)eixωdω.

が成り立つ。コーシー=シュワルツの不等式プランシュレルの定理より、任意のxについて以下が成り立つ。

|f(x)|12πaa2a|F(ω)|2dω=1πa2|F(ω)|2dω=aπfL2.

この不等式より評価汎函数が有界であり、したがってHがRKHSであることが示せた。

この例での核関数Kx

Kx(y)=aπsinc(aπ(yx))=sin(a(yx))π(yx).

で表される。上の式で定義されたKx(y)のフーリエ変換は、

Kx(y)eiωydy={eiωxif ω[a,a],0otherwise,

である。したがって、プランシュレルの定理より

f,KxL2=f(y)Kx(y)dy=12πaaF(ω)eiωxdω=f(x).

となり、核の再生性を実際に確認できた。

このKxディラックのデルタ関数の「帯域制限版」であり、遮断周波数aが無限に行くとKx(y)δ(yx)に収束する。

ムーア・アロンシャインの定理

ここまで、再生核ヒルベルト空間から、対称で正定値(英語版)な再生核関数を定義してきた。一方ムーア・アロンシャインの定理は逆方向の定理である。つまり、対称で正定値な核を1つとると、再生核ヒルベルト空間がただ1つに定まるという定理である。この定理は当初「アロンシャインの再生核定理」と呼ばれていたが、彼がE・H・ムーアの名を定理につけた。

定理 Kを集合X上の対称正定値核とすると、Kが再生核であるようなX上のヒルベルト空間がただ1つ存在する。

証明 X上の任意のxに対してKx=K(x,)と定義する。H0{Kx:xX}の線形空間とする。H0上の内積を以下のように定義する。

j=1nbjKyj,i=1maiKxiH0=i=1mj=1naibjK(yj,xi),

この定義からK(x,y)=Kx,KyH0を得る。内積の対称性はKの対称性から示せ、内積の正定値性もKの正定値性から示せる。

H0を内積に関して完備にしたものをHとする。Hは以下の形で表される関数で構成される。

f(x)=i=1aiKxi(x)wherelimnsupp0i=nn+paiKxiH0=0.

すると、再生性(テンプレート:EquationNote)を示せる:

f,KxH=i=1aiKxi,KxH0=i=1aiK(xi,x)=f(x).

一意性を証明するために、Gを、Kが再生核であるような、関数から成るヒルベルト空間とする。Xの任意のxyについて、

Kx,KyH=K(x,y)=Kx,KyG.

線形性より,H=,G{Kx:xX}の張る空間上で成り立つ。Gは完備であってH0を含むから、H0を完備化したものを含む、つまりHG

ここから、逆にGの任意の要素がHの要素であることであることを示したい。fGの要素とする。HGの部分空間だから、fHHfHHを使ってf=fH+fHと分解できる。今xXについて、KGHの再生核であるから、

f(x)=Kx,fG=Kx,fHG+Kx,fHG=Kx,fHG=Kx,fHH=fH(x),

が成り立つ。KxHに属するからGでのfHとの内積が0となる事実を使った。上の式からGf=fHが成り立ち、証明完了となる。

積分作用素とマーサーの定理

テンプレート:仮リンクを使えば、積分作用素を通して対称正定値核Kを特徴づけることができ、RKHSの新たな視点を得ることが出来る。Xを狭義正で有限なボレル測度μがあるようなコンパクト集合であるとし、K:X×Xを連続対称正定値関数とする。積分作用素TK:L2(X)L2(X)を以下のように定義する。

[TKf]()=XK(,t)f(t)dμ(t)

ただし、L2(X)μの測度の下で自乗可積分な関数の空間である。

マーサーの定理によると、積分作用素TKの固有値と固有関数がKのテイラー展開を意味している。したがって、この固有値と固有関数を使って、再生核がKであるようなRKHSを構成できる。詳細は以下の通りである。

上記の仮定のもとでは、TKはコンパクトで連続で自己随伴で正定値な作用素である。自己随伴な作用素についてのスペクトル定理より、limiσi=0たる減少列(σi)i0が存在して、L2(X)の正規直交基底{φi}を用いてTKφi(x)=σiφi(x)と表せる。TKの正定値性より、任意のiに対してσi>0となる。更に、TKは連続関数の空間C(X)へ連続的に写像するから、連続関数を固有ベクトルとできる。つまり、任意のiに対してφiC(X)である。したがって、マーサーの定理から、Kは固有値と連続な固有写像を用いて以下のように書ける。

K(x,y)=j=1σjφj(x)φj(y)

ただし、上の式は、任意のx,yXに対して

limnsupu,v|K(u,v)j=1nσjφj(u)φj(v)|=0

が成り立つことを意味している。このような級数表現は、Kのマーサー核やマーサー表現と呼ばれる。

更に、再生核がKであるようなRKHSHは以下のように与えられる。

H={fL2(X)|i=1f,φiL22σi<}

ここで、Hの内積は以下の式である。

f,gH=i=1f,φiL2g,φiL2σi.

である。RKHSのこのような表現は、確率や統計で応用があり、例えば確率過程でのテンプレート:仮リンクテンプレート:仮リンクなどがある。

特徴写像

特徴写像とは、特徴空間と呼ばれるヒルベルト空間Fに移す写像φ:XFである。これまでの章では、有界連続な評価関数と、正定値関数と、積分作用素の間の関係を見てきた。この章では、特徴写像を使った別のRKHSの表現を説明する。

特徴写像はテンプレート:NumBlkを通して核を定義する。Kは明らかに対称であり、更にFでの内積の性質から正定値性も得られる。逆に、各正定値関数と対応する再生核ヒルベルト空間には、(テンプレート:EquationNote)が成り立つような特徴写像が無限にある。

例えば、簡単なものではF=H、任意のxXに対してφ(x)=Kxとすれば良い。このようにすれば、再生性から(テンプレート:EquationNote)が成り立つ。他に典型的な特徴写像の例としては、前の章の積分作用素に関連したもので、F=2φ(x)=(σiφi(x))iとするものもある。

核と特徴写像の間のこのような関係から、正定値関数(Hの内積としての再生核)の新しい理解の仕方が得られる。更に、各特徴写像から、正定値関数の定義を通してRKHSを自然に定義できる。

最後に、特徴写像から、RKHSの新しい観点を明らかにするような関数空間を構築できる。以下の線形空間を考える。

Hφ={f:XwF,f(x)=w,φ(x)F, xX}.

Hψ上のノルムを以下のように定義できる。

fφ=inf{wF:wF,f(x)=w,φ(x)F, xX}.

Hφは、核がK(x,y)=φ(x),φ(y)Fで定義されたRKHSとなる。この表現では、RKHSの要素は特徴空間の要素同士の内積であり、したがってRKHSの世周防は超空間として見ることができる。RKHSのこの見方は、機械学習でのカーネル法と関係がある。[7]

性質

RKHSの有用な性質として以下のようなものがある。

  • (Xi)i=1pを集合の列とし、(Ki)i=1p をそれぞれ(Xi)i=1p上の正定値関数とする。すると、
    K((x1,,xp),(y1,,yp))=K1(x1,y1)Kp(xp,yp)
    X=X1××Xp上の核である。
  • X0Xとすると、Kの定義域をX0×X0に制限したものもまた再生核となる。
  • 任意のxXについてK(x,x)=1となるように正規化したKを考える。 X上の擬距離空間を以下のように定義する。
    dK(x,y)=KxKyH2=2(1K(x,y))xX.
    コーシー=シュワルツの不等式より、
    K(x,y)2K(x,x)K(y,y)=1x,yX.
    このこの不等式から、Kは入力間のテンプレート:仮リンクと見ることができる。x,yXが似ていればK(x,y)は1に近くなり、x,yXが似ていなければ、K(x,y)は0に近くなる。
  • {KxxX}によって生成される空間の閉包はHと一致する。[7]

一般的な例

双線形核

K(x,y)=x,y

であるようなRKHSである。

この核に対応するRKHS Hは、fH2=β2を満たすβf(x)=x,βと表される関数で構成された双対空間である。

多項式核

K(x,y)=(αx,y+1)d,α,d

他の一般的な核として、K(x,y)=K(xy)を満たすものがある。例えば以下がある。

  • ガウシアン(自乗指数):
    K(x,y)=exy22σ2,σ>0
  • ラプラシアン核:
    K(x,y)=exyσ,σ>0
    この核で定義されたRKHS Hにある関数fの自乗ノルムは以下の通りである。[8]
    fH2=(1σf(x)2+σf(x)2)dx.

次にベルグマン核の例を説明する。Xを有限集合とし、X上の全ての複素数値関数から構成される空間をHとする。すると、Hの要素は複素数列と解釈することができる。内積を複素ベクトルとしての内積で定義すると、Kxxで1となり他で0となるような関数となる。つまり

K(x,y)={1x=y0xy

となるから、K(x,y)は単位行列と考えることができる。この場合、Hnと同型である。

X=𝔻 (𝔻単位円板)の場合はより複雑である。ベルグマン空間 H2(𝔻) は、𝔻上の二乗可積分正則関数の空間である。H2(𝔻)の再生核は

K(x,y)=1π1(1xy)2

であることが示せる。最後に、L2()の要素であって帯域幅が2aであるような帯域制限関数の空間は、再生核が

K(x,y)=sina(xy)π(xy)

ベクトル値関数への拡張

この章では、RKHSの定義をベクトル値関数空間に拡張する。この拡張は、テンプレート:仮リンクテンプレート:仮リンクで特に重要である。ベクトル値関数空間となって生じる主な違いは、再生核Γが、Xの任意の要素x,yに対して半正定値行列であるような対称関数であることである。より厳密には、ベクトル値RKHS(vvRKHS)は、任意のcTxXについて

Γxc(y)=Γ(x,y)cH for yX

f,ΓxcH=f(x)c.

となるような関数f:XTのヒルベルト空間と定義される。この2つ目の性質がスカラー値の場合の再生性に対応している。この定義でも、スカラー値RKHSで見ていたような積分作用素、有界評価関数、特徴空間との関係が成り立つ。 vvRKHSの同値な定義として有界な評価汎関数のあるベクトル値ヒルベルト空間をとり、Rieszの表現定理から再生核の唯一存在性を示すことができる。Mercerの定理もベクトル値に拡張することができ、したがってvvRKHSの特徴写像による見方も得られる。最後に、{Γxc:xX,cT}の張る空間の閉包がHと一致することも示せ、ここでスカラー値の場合と似た性質が得られる。

要素ごとに見ることでvvRKHSを直感的に理解できる。Λ={1,,T}とする。空間X×Λと対応する再生核テンプレート:NumBlkを考える。上に述べたとおり、この再生核に対応するRKHSは{γ(x,t):xX,tΛ}が張る空間の閉包で与えられる。ただし、任意のペアテンプレート:Nowrapに対してγ(x,t)(y,s)=γ((x,t),(y,s))である。

スカラー値RKHSとの関係は、行列値核が(テンプレート:EquationNote)の核と以下の式で関連していることから分かる。

Γ(x,y)(t,s)=γ((x,t),(y,s)).

更に、(テンプレート:EquationNote)の形の核は上の式で行列値核を定義する。では、写像D:HΓHγ

(Df)(x,t)=f(x),etT

と定義する。ただし、etTの直交基底のt番目の要素である。Dは全単射であり、HΓHγの間の等長写像となる。

vvRKHSのこのような見方はマルチタスク学習で有用ではあるものの、この等長変換はベクトル値の場合の研究をスカラー値の場合の研究に帰結させるものではない。実際、この等長変換によってもともとの核の性質がたびたび無くなり、スカラー値核や入力空間が複雑になりすぎる。[9][10][11]

行列値再生核の中でも重要な種類に、スカラー値核とT次元対称半正定値行列の積で表されるような、分離可能核と呼ばれるものがある。これまでの議論の観点から表せば、分離可能核はXの任意の要素x,yTの任意の要素s,tに対して以下の式で表される。

γ((x,t),(y,s))=K(x,y)KT(t,s)

スカラー値核が入力間の依存関係を表現していたのに対して、行列値核は入力と出力の両方の依存関係を表現していることが分かる。

最後に、このような理論は更に関数空間の関数空間に拡張できるが、このような空間での核を得るのはより難しい。[7]

RKHSとReLU関数の関係

ReLU関数は通常f(x)=max{0,x}で定義され、活性化関数としてReLU関数が使われているニューラルネットワークの構造の中枢である。 再生核ヒルベルト空間を使ってReLUに似た非線形関数を構築することができる。以下、実際に構築の仕方を紹介し、そこから ReLUが活性化関数に使われているニューラルネットワークの表現力を導出する過程を説明する。

ヒルベルト空間として、f(0)=0であって導関数が自乗可積分な関数の空間=L21(0)[0,)を考える。内積は以下のように定義する。

f,g=0f(x)g(x)dx

再生核を構成するためには密な部分空間を考えれば十分であるから、fC1[0,)かつf(0)=0とする(?)。微分積分学の基本公式から

f(y)=0yf(x)dx=0G(x,y)f(x)dx=Ky,f

となる。ただし

G(x,y)={1,x<y0,otherwise
K(x,y)=Ky(x)=0xG(z,y)dz={x,0x<yy,otherwise.=min(x,y)

更にX×X=[0,)×[0,)上のmin関数はReLU関数で以下のように表現できる。

min(x,y)=xReLU(xy)=yReLU(yx)

この式を使って、テンプレート:仮リンクをこのRKHSにを適用すると、ニューラルネットワークにおいてReLU活性化関数を使うのが最適だと証明できる。テンプレート:要出典

関連項目

出典

テンプレート:Reflist

参考文献

  1. Alpay, D., and T. M. Mills. "A family of Hilbert spaces which are not reproducing kernel Hilbert spaces." J. Anal. Appl. 1.2 (2003): 107–111.
  2. Z. Pasternak-Winiarski, "On weights which admit reproducing kernel of Bergman type", International Journal of Mathematics and Mathematical Sciences, vol. 15, Issue 1, 1992.
  3. T. Ł. Żynda, "On weights which admit reproducing kernel of Szeg¨o type", Journal of Contemporary Mathematical Analysis (Armenian Academy of Sciences), 55, 2020.
  4. Okutmustur
  5. Paulson
  6. Durrett
  7. 7.0 7.1 7.2 Rosasco
  8. Berlinet, Alain and Thomas, Christine. Reproducing kernel Hilbert spaces in Probability and Statistics, Kluwer Academic Publishers, 2004
  9. De Vito
  10. Zhang
  11. Alvarez