凸共役性

提供: testwiki
ナビゲーションに移動 検索に移動


数学において凸共役(とつきょうやく、テンプレート:Lang-en-short)とは、ルジャンドル変換の一般化である。ルジャンドル=フェンシェル変換あるいはフェンシェル変換としても知られる(アドリアン=マリ・ルジャンドルテンプレート:仮リンクの名にちなむ)。

定義

以下、特に断りがなければ、ベクトル空間はすべて実係数のものを考える。テンプレート:Math theorem

直観的意味

Sの支持超平面(点線)

上記の定義の直観的な意味を説明するため、ベクトル空間テンプレート:Mvarの図形のテンプレート:仮リンクを定義する。超平面ΠVが集合SV支持超平面テンプレート:Lang-en-shortテンプレート:Mvarとは、テンプレート:Mvarテンプレート:Mvarの閉包の点を少なくとも1つ含み、しかもVテンプレート:Mvarで2つ切ったときに片方にはテンプレート:Mvarの点が入っていない事をいう[1]


凸共役の直観的な意味を考えるため、テンプレート:Mvarエピグラフ

epif={(x0,y0)X×y0f(x0)}

を考える。 テンプレート:Math theorem テンプレート:Math proof

すなわち、a*X*におけるfの凸共役f*(a*)は「傾き」a*の支持超平面の「y切片」bにマイナスをつけたものと解釈できる。

滑らかな場合

テンプレート:Mvarが有限次元のベクトル空間で、テンプレート:Mvar滑らかな凸関数であるとき、傾きx*の支持超平面を接平面として持つ点をxとすると、すなわち

x*=gradf(x)

となる点をxとすると、テンプレート:Mvarの凸性からそのxにおいてsupが達成されるので、

f*(x*)=x*,xf(x)

が成立する。よってこの場合には、凸共役は通常のルジャンドル変換に一致する。

基本的性質

本節ではテンプレート:Mvarノルム空間(例えば有限次元の計量ベクトル空間)とし、f,g:X{±}を関数とする。

前述のように凸共役は直観的には支持超平面によって特徴づけられるが、集合Sの支持超平面は、Sの閉包の支持超平面やSの凸包の支持超平面と一致するので、以下が成立する: テンプレート:Math theoremまた凸共役の定義から明らかに次が従う:テンプレート:Math theorem上記の不等式を用いると、次が成立する事を簡単に示せる:テンプレート:Math theorem一般にはf**(x)=f(x)は成立しないが、次節でf**(x)=f(x)が成立する条件を説明する。さらに以下が成立する:テンプレート:Math theorem

二重共役

本節でもテンプレート:Mvarをノルム空間とする。凸共役を二度取ったf**(x)は元のf(x)に一致する事は保証されない(なお、f**(x)=f(x)と違い、f***(x*)=f*(x*)は無条件に成立する[2])。しかし以下が成立する事を示せる:

テンプレート:Math theoremここで関数g:X{±}プロパーであるとは、テンプレート:Mvarが恒等的にテンプレート:Mvarを取らない事を指す。

convfは凸関数なので、プロパーな関数ff**(x)=f(x)を満たすのはfが凸な場合に限られる。そのような関数に対してconvf(x)=f(x)が成立する条件を具体的に書き表す事で以下が成立する事がわかる:

テンプレート:Math theorem上記の定理は各点毎に成立する。すなわち、プロパーな凸関数fが点xXにおいてf**(x)=f(x)を満たす必要十分条件は、fxにおいて下半連続な事である[3]

なお、テンプレート:Mvarバナッハ空間であれば凸関数テンプレート:Mvarが下半連続であればdomf内点で連続である[4]。とくに有限次元のベクトル空間であれば、(下半連続性の仮定がなくとも)domf内点で連続である事が示せる[5]。よってこの場合、下半連続性を問われるのは境界点のみである。

また、(バナッハ空間とは限らない)ノルム空間の凸部分集合上定義された凸関数は一点で連続であればその凸部分集合上の全点で連続である事も知られている[4]

フェンシェルの双対性

本節では、凸共役を最適化問題に応用するうえで鍵となるフェンシェルの双対性について説明する。

定理のステートメント

まずは応用について考えず、天下り的に定理を与える。

テンプレート:Mvarテンプレート:Mvarノルム空間とし、T:XY有界線形作用素(例えばテンプレート:Mvarテンプレート:Mvarが有限次元の計量ベクトル空間でテンプレート:Mvarが線形写像)とし、さらにf:X{±}g:Y{±}を2つの関数とする。さらに下限テンプレート:Mvarを求める問題と上限テンプレート:Mvarを求める問題

p=infxX(f(x)+g(Tx))
d=supy*Y*(f*(T*y)g*(y*))

を考える。これらの問題をフェンシェル問題テンプレート:Lang-en-short[6]といい、後者を前者の(そして前者を後者の)双対問題という。このとき前述したフェンシェル・ヤングの不等式から次が成立する。テンプレート:Math theoremさらに次が成立する:テンプレート:Math theoremここで集合FXに対し、

coreF:={xXhs.t.h=1δ>0t[0,δ]:x+thF}

であり[7]contgテンプレート:Mvarの連続な点全体の集合である[7]

応用

CX

DY

を閉凸集合とし、以下の問題を考える:

minimizexCF(x)subject to TxDテンプレート:EquationRef

すなわち、

xC

TxD

という条件下

F(x)

の最小値

p

を求めよ、という問題である。

上記の問題はフェンチェル問題の特殊な場合とみなす事ができる。実際、集合テンプレート:Mvarに対し、その指示関数テンプレート:Lang-en-short)を

ιA(x):={0if xAotherwise

と定義し、

f(x)=F(x)+ιC(x)
g(x)=ιD(x)

とすると、問題1はフェンチェル問題p=infxX(f(x)+g(Tx))に一致する[7]

したがってテンプレート:Mvarをその双対問題d=supy*Y*(f*(T*y)g*(y*))テンプレート:Mvarで下から抑えたり、等号成立条件が成り立っていれば双対問題の方を具体的に調べる事でp=dを求めたりする事が可能になる。

凸共役の例

アフィン函数

f(x)=a,xb,an,b

の凸共役は

f(x*)={b,x*=a+,x*a.

である。冪函数

f(x)=1p|x|p,1<p<

の凸共役は

f(x*)=1q|x*|q,1<q<

である。ここで 1p+1q=1 である。

絶対値函数

f(x)=|x|

の凸共役は

f(x*)={0,|x*|1,|x*|>1

である。指数函数 f(x)=ex の凸共役は

f(x*)={x*lnx*x*,x*>00,x*=0,x*<0

である。指数函数の凸共役とルジャンドル変換は、凸共役の定義域が厳密に大きいことを除いて一致する。ルジャンドル変換は正の実数に対してのみ定義されるためである。

期待ショートフォール(リスク平均値)との関係

F確率変数 X累積分布函数とする。このとき、部分積分により

f(x):=xF(u)du=E[max(0,xX)]=xE[min(x,X)]

は次の凸共役を持つ。

f(p)=0pF1(q)dq=(p1)F1(p)+E[min(F1(p),X)]=pF1(p)E[max(0,F1(p)X)].

順序

特別な解釈により次の変換が考えられる。

finc(x):=argsupttx01max{tf(u),0}du,

これは初期函数 f の非減少な書き換えである。特に、f に対する finc=f は非減少である。

性質

閉凸函数の凸共役は再び閉凸函数である。多面体的凸函数(多面体的エピグラフを持つ凸函数)の凸共役は、再び多面体的凸函数である。

凸性

二つの函数 f0f1 および数 0λ1 に対し、次の凸関係が成立する。

((1λ)f0+λf1)(1λ)f0+λf1

この演算 はそれ自身が凸写像である。

極小畳み込み

二つの函数 fg極小畳み込み(infimal convolution)は、次で定義される(epi-sum とも呼ばれる):

(fg)(x)=inf{f(xy)+g(y)yn}.

f1, …, fmRn 上の真凸かつ下半連続な函数とする。このとき、これらの極小畳み込みは凸かつ下半連続である(が、必ずしも真凸ではない)[8]。さらに次が成立する。

(f1fm)=f1++fm.

二つの函数の極小畳み込みは、次のような幾何学的解釈がある:二つの函数の極小畳み込みの(厳密な)エピグラフは、それらの函数の(厳密な)エピグラフのテンプレート:仮リンクである[9]

最大化引数

函数 f が微分可能であるなら、その導函数は凸共役の計算における最大化引数(maximizing argument)である。すなわち、

f(x)=x*(x):=argsupxx,xf(x)
f(x)=x(x):=argsupxx,xf(x);

が成り立つ。したがって

x=f(f(x)),
x=f(f(x)),

であり、さらに次が成立する。

f(x)f(x(x))=1,
f(x)f(x(x))=1.

スケーリング性

ある γ>0 に対し、g(x)=α+βx+γf(λx+δ) であるなら、次が成り立つ。

g(x)=αδxβλ+γf(xβλγ).

さらにパラメータ α が追加される場合は、次が成り立つ。

fα(x)=fα(x~).

ここで x~ は最大化引数であるように選ばれる。

線型変換の下での挙動

AX から Y への有界線型作用素とする。X 上の任意の凸函数 f に対して、次が成り立つ。

(Af)=fA

ここで

(Af)(y)=inf{f(x):xX,Ax=y}

fA に関する原像であり、A*A共役作用素である[10]

閉凸函数 f は、ある与えられた直交線型変換の集合 G に関して対称である、すなわち

f(Ax)=f(x),x,AG

であるための必要十分条件は、凸共役 f*G に関して対称であることである。

代表的な凸共役の表

次の表では、多くの有名な函数のルジャンドル変換で、有用な性質を持つものが示されている[11]

g(x) dom(g) g*(x*) dom(g*)
f(ax) (where a0) X f*(x*a) X*
f(x+b) X f*(x*)b,x* X*
af(x) (where a>0) X af*(x*a) X*
α+βx+γf(λx+δ) X αδx*βλ+γf*(x*βγλ)(γ>0) X*
|x|pp (where p>1) |x*|qq (where 1p+1q=1)
xpp (where 0<p<1) + (x*)qq (where 1p+1q=1)
1+x2 1(x*)2 [1,1]
log(x) ++ (1+log(x*))
ex {x*log(x*)x*if x*>00if x*=0 +
log(1+ex) {x*log(x*)+(1x*)log(1x*)if 0<x*<10if x*=0,1 [0,1]
log(1ex) {x*log(x*)(1+x*)log(1+x*)if x*>00if x*=0 +


関連項目

出典

  1. テンプレート:Cite web
  2. #Ekeland p.18
  3. 引用エラー: 無効な <ref> タグです。「Borwein-Luke-23」という名前の注釈に対するテキストが指定されていません
  4. 4.0 4.1 テンプレート:Cite web
  5. #Borwein
  6. #Borwein-Luke p.25.
  7. 7.0 7.1 7.2 #Borwein-Luke p.3.
  8. テンプレート:Cite book
  9. テンプレート:Cite journal
  10. Ioffe, A.D. and Tichomirov, V.M. (1979), Theorie der Extremalaufgaben. Deutscher Verlag der Wissenschaften. Satz 3.4.3
  11. #Borwein pp.50-51

参考文献

外部リンク