ウルフ条件

提供: testwiki
ナビゲーションに移動 検索に移動

テンプレート:翻訳直後

ウルフ条件(ウルフじょうけん、テンプレート:Lang-en-short)とは、無制約最適化問題において非厳密直線探索を行う際に用いられる一連の不等式をいう。特に準ニュートン法を行う際によく用いられる。1969年テンプレート:仮リンクが初めて発表した[1][2]

ある滑らかな関数 f:n について無制約最適化問題 minxf(𝒙) を解く際、近似的な部分問題 minαf(𝒙k+α𝒑k) を解くことがしばしばある。ここで テンプレート:Mvar は現在の反復における最適推定解、𝒑kn は探索方向、α はステップ長である。

非厳密直線探索は、損失関数を厳密に最小化するのではなく、「十分に」小さくするステップ長 α+ を得る効率的な方法を提供する。これを行う際、ウルフ条件は新たな探索方向 テンプレート:Mvar を探索する前にある テンプレート:Mvar の推定値が満たすべき条件として用いられる。

アルミホ条件と曲率条件

あるステップ長 テンプレート:Mvar がウルフ条件を満たすとは、探索方向 テンプレート:Mvar が与えられたものとして以下の2つの不等式が成り立つことをいう。テンプレート:Ordered list ここで、テンプレート:Math である(不等式iiを評価する際、たとえば最急降下法の場合は 𝒑k=f(𝒙k)ニュートン法の場合は 𝒑k=𝑯1f(𝒙k)テンプレート:Mvar が正定値行列であるため 𝒑kf(𝒙k)<0 が成り立つことに留意する)。

テンプレート:Math は十分に小さく、テンプレート:Math は十分に大きくとることが多い。テンプレート:仮リンクとライトはニュートン法および準ニュートン法については テンプレート:Math非線形共役勾配法については テンプレート:Math を例として与えている[3]。不等式iはアルミホ条件テンプレート:Efn[4]と呼ばれ、不等式iiは曲率条件と呼ばれる。不等式iはステップ長 テンプレート:Mvarテンプレート:Mvar を「十分に」減少させることを、iiは勾配が十分に減少したことを保証する。条件iおよびiiはステップ長の上限と下限をそれぞれ与えるものとして解釈することができる。

強いウルフ条件

方向 テンプレート:Mvar に制限した一変数関数 テンプレート:Math を考える。ウルフ条件は テンプレート:Mvar の最適点からは遠いステップ長を与える場合がある。曲率条件を次のように変更したとする: テンプレート:Ordered list。iおよびiiiは強いウルフ条件と呼ばれ、テンプレート:Mvarテンプレート:Mvar臨界点付近に制限する。

理論的根拠

最適化アルゴリズムにウルフ条件を課す主な理由は、勾配がゼロに収束することを保証するためである。特に、テンプレート:Mvar と勾配とのテンプレート:仮リンク cosθk=f(𝐱k)T𝐩kf(𝐱k)𝐩k がゼロから遠くかつ条件iおよびiiが満たされる場合、f(𝐱k)0 が成り立つ。

もうひとつの動機は、𝒑k=Bk1f(𝒙k) のように方向を求める準ニュートン法の場合、行列 テンプレート:MvarBFGS法DFP法で更新する。テンプレート:Mvar が正定値かつiおよびiiが成り立つならば テンプレート:Math も正定値となる。

注意

ウルフ条件はアルミホ条件よりも複雑であり、ウルフ条件にもとづく勾配降下法よりもアルミホ条件に基づいた値のほうがより良い理論的保証がある(Backtracking line search"Upper bound for learning rates"節および"Theoretical guarantee"節を参照)。

脚注

テンプレート:脚注ヘルプ

注釈

テンプレート:Notelist

出典

テンプレート:Reflist

参考文献

関連項目

テンプレート:最適化アルゴリズム