劣勾配法

提供: testwiki
ナビゲーションに移動 検索に移動

劣勾配法(れつこうばいほう、テンプレート:Lang-en-short)とは、劣微分を用いた凸最適化の解法である。1960年代から1970年代にかけてテンプレート:仮リンクによって編み出された解法であり、微分不可能な目的関数に対して収束性を持つことが知られている。目的関数が微分可能な関数で無制約な問題の場合は最急降下法と同様の探索方向が使用される。

劣勾配法は2階微分可能な連続凸最小化問題に対してニュートン法より収束が遅いが、ニュートン法は微分不可能な点を持つ問題に対して適用することができないことから、汎用性が高い解法である。

近年では、凸最適化問題に対して内点法が提案されているが、射影劣勾配法やバンドル法といった解法も研究がなされている。劣勾配法などは計算にかかるメモリの量が比較的少量で済むことから、高次元の凸最適化問題に対しては適した解法である。

射影劣勾配法は大規模問題に対して分解法と共に使用されることが多い。分解法を用いることで問題を分割して問題を安易に扱うことができる。

古典的な劣勾配法の規則

定義域 n. において凸関数f:n とする。 最も古典的な劣勾配法は以下の式によって反復点が更新される: x(k+1)=x(k)αkg(k)  ただし g(k) は 点 x(k)  における f 劣勾配を表し、x(k)k 回目の x を表す。 もし f  が微分可能関数であるならば、劣勾配は勾配 f と等しい。 ある反復において劣勾配 g(k)x(k)f  における降下方向ではない可能性もあり得る。したがって反復を通じて最良の目的関数値 fbest  を記録する必要があり、これは: fbest(k)=min{fbest(k1),f(x(k))} と表される。

ステップサイズ規則

劣勾配法にはいくつかのステップサイズ規則が知られている。本記事では収束性が証明されている古典的なステップサイズ規則について説明する。

  • Constant step size: αk=α.
  • Constant step length: αk=γ/g(k)2. ただし、x(k+1)x(k)2=γ.
  • Square summable but not summable step size: 以下の性質を満たすものαk0,k=1αk2<,k=1αk=.
  • Nonsummable diminishing: 以下の性質を満たすものαk0,limkαk=0,k=1αk=.
  • Nonsummable diminishing step lengths: αk=γk/g(k)2. ただし、γk0,limkγk=0,k=1γk=.

上記のステップサイズの規則ではステップサイズは反復開始前にあらかじめ固定するオフライン型に分類される。つまり各ステップサイズは各反復における情報を利用しない。このオフライン型の規則は微分可能関数に対する降下法で用いられるオンライン型のステップサイズの規則とは異なった規則となっている。具体的には微分可能関数の最小化問題に対する手法ではウルフ条件を満たすステップサイズを選択する。このときステップサイズは各反復における点や探索方向を用いて決定される。(改良型を含む)劣勾配法におけるステップサイズの規則に関する内容は Bertsekasテンプレート:Sfnおよび Bertsekas、Nedic、Ozdaglarテンプレート:Sfn の著書にまとめられている。

収束の結果

constant step-length を使用し劣勾配のユークリッドノルムが1となるようにスケーリングした場合、劣勾配法は最小値に十分近い値へ収束することがテンプレート:仮リンクにより示されている[1]。すなわち、

limkfbest(k)f*<ϵ

が成り立つ。古典的なこれらの劣勾配法は収束が遅いことから、現在では一般的な問題に対して推奨されていないが[2][3]、特定の問題ではその問題特有の性質を活かすことで簡単に適応するできるため、広く用いられている。

射影劣勾配法とバンドル法

1970年代、凸最適化問題に対して降下法の一種のバンドル法テンプレート:Efnテンプレート:仮リンクテンプレート:仮リンクによって提案されたテンプレート:Sfn。バンドル法は提案当時と現在において違う意味合いで用いられていた。現在知られている改良型のバンドル法や収束性の解析についてはKiwielによってによってまとめられた[4]。 現在のバンドル法はボリス・ポリャク(1969)の射影劣勾配法から編み出されたステップサイズ決定のためのLevel Control規則を用いている。しかし、特定の問題では射影劣勾配法の方がバンドル法よりも優位性を持っている[2][3]

制約付き最適化問題

射影勾配法

劣勾配法を拡張させた解法として射影劣勾配法が挙げられる。以下の最適化問題:

minimize f(x)  subject to x𝒞

を考える。ただし、𝒞凸集合を表す。 射影劣勾配法は以下の式によって値を更新していく: x(k+1)=P(x(k)αkg(k)) ただし、P𝒞 の射影、かつ g(k)x(k) における f  の劣勾配を表す。

一般の制約

劣勾配法は不等式制約付き最適化問題に対する解法として拡張することができる。以下の最適化問題を考える:

minimize f0(x)  subject to fi(x)0,i=1,,m

ただし、fi は凸関数である。不等式制約付き最適化問題においても無制約最適化問題と同様に更新式は x(k+1)=x(k)αkg(k)  となる。ただし、αk>0 はステップサイズであり、g(k)x  における目的関数・制約の関数の劣勾配を表す。すなわち、 g(k)={f0(x) if fi(x)0i=1mfj(x) for some j such that fj(x)>0 と表される。ただし、ff 劣微分である。現在の反復点が制約を満たす場合、劣勾配法は目的関数の劣勾配により値を更新する。現在の反復点が制約を満たさない場合、劣勾配法は違反している制約関数の劣勾配から値を更新する。

脚注

テンプレート:脚注ヘルプ

注釈

テンプレート:Notelist

出典

テンプレート:Reflist

参考文献

関連項目

外部リンク

  • EE364A and EE364B, Stanford's convex optimization course sequence.

テンプレート:最適化アルゴリズム

  1. The approximate convergence of the constant step-size (scaled) subgradient method is stated as Exercise 6.3.14(a) in Bertsekas(636頁): テンプレート:Harvnb, Bertsekas attributes this result to Shor: テンプレート:Harvnb
  2. 2.0 2.1 テンプレート:Cite book
  3. 3.0 3.1 テンプレート:Cite journal
  4. テンプレート:Cite book