フランク・ウルフのアルゴリズム

フランク・ウルフのアルゴリズム (テンプレート:Lang-en-short) とは、テンプレート:仮リンク付き凸最適化問題を反復的一次最適化により解くアルゴリズムである。条件付き勾配法 (テンプレート:Lang)、^[1] 簡約勾配法 (テンプレート:Lang)、 凸結合法 (テンプレート:Lang) とも呼ばれ、1956年にテンプレート:仮リンクおよびテンプレート:仮リンクにより提案された^[2]。このアルゴリズムでは、各反復毎に目的関数の線形近似を行い、この（定義域を同じくする）線形関数を最適化する方向へと移動する。

問題定義

$𝒟$ をベクトル空間上のコンパクトな凸集合とし、 $f : 𝒟 \to ℝ$ を微分可能な凸実関数とする。フランク・ウルフのアルゴリズムは、以下の最適化問題を解く。

Minimize

f (𝐱)

subject to

𝐱 \in 𝒟

.

アルゴリズム

初期化:

k \leftarrow 0

とし、

𝐱_{0}

を

𝒟

に含まれる任意の点とする。

ステップ 1. 降下方向の決定: 次の条件を満たす

𝐬_{k}

を解く。

Minimize

𝐬^{T} \nabla f (𝐱_{k})

Subject to

𝐬 \in 𝒟

（この部分問題は、

f

を

𝐱_{k}

近傍で1次までテイラー近似して得られる線形関数を最小化するものと捉えることができる。）

ステップ 2. ステップサイズの決定:

α \leftarrow \frac{2}{k + 2}

とする。もしくは、

0 \leq α \leq 1

を満す範囲内で、

f (𝐱_{k} + α (𝐬_{k} - 𝐱_{k}))

を最小化するようなテンプレート:Mvar を算出する。

ステップ 3. 更新:

𝐱_{k + 1} \leftarrow 𝐱_{k} + α (𝐬_{k} - 𝐱_{k})

とし、

k \leftarrow k + 1

とした上でステップ 1. に戻る。

性質

たとえば最急降下法など、他の条件付き最適化問題の解法においては各反復毎に許容範囲を射影する必要があるのに対し、フランク・ウルフのアルゴリズムは全ての反復で同一の範囲について部分問題を解けば、解は自動的に許容範囲に収まる。

フランク・ウルフのアルゴリズムの収束性は一般には劣線形である。勾配がなんらかのノルムについてリプシッツ連続であれば、k 回の反復の後の目的関数の値と最適値との誤差は $O (1 / k)$ となる。部分問題を近似的に解いた場合でも同様の収束速度を実現することが示されている^[3]。

本アルゴリズムの各反復は、つねに許容範囲の極点の疎凸結合で表現することができる。このため、機械学習や信号処理^[4]および、例えば最小コストフロー問題などのテンプレート:仮リンク^[5]によく用いられる疎貪欲法アルゴリズムを応用することができる。

許容範囲がもし一連の線形拘束条件により与えられている場合、各反復における部分問題は線型計画法により解くことができる。

一般の問題について最悪収束速度 $O (1 / k)$ を改善することは不可能であるが、たとえば強凸問題など特定の種類の問題について、より早い収束速度を得ることはできる^[6]。

解の値の下限と主双対解析

$f$ は凸関数であるから、任意の二点 $𝐱, 𝐲 \in 𝒟$ に対し次の不等式が成立する。

f (𝐲) \geq f (𝐱) + (𝐲 - 𝐱)^{T} \nabla f (𝐱)

この不等式は（未知の）最適解 $𝐱^{*}$ $f (𝐱^{*}) \geq f (𝐱) + (𝐱^{*} - 𝐱)^{T} \nabla f (𝐱)$ ある点 $𝐱$ について、最適な下限は次のように与えられる。

\begin{matrix} f (𝐱^{*}) & \geq f (𝐱) + (𝐱^{*} - 𝐱)^{T} \nabla f (𝐱) \\ \geq \min_{𝐲 \in D} {f (𝐱) + (𝐲 - 𝐱)^{T} \nabla f (𝐱)} \\ = f (𝐱) - 𝐱^{T} \nabla f (𝐱) + \min_{𝐲 \in D} 𝐲^{T} \nabla f (𝐱) \end{matrix}

フランク・ウルフのアルゴリズムは、各反復において上式最終項の最適化問題を解くので、降下方向決定部分問題における解 $𝐬_{k}$ を用いて解の下限 $l_{k}$ を徐々に更新していくことができる。すなわち、 $l_{0} = - \infty$ とおくと次のように更新すればよい。

l_{k} : = \max (l_{k - 1}, f (𝐱_{k}) + (𝐬_{k} - 𝐱_{k})^{T} \nabla f (𝐱_{k}))

このように未知の最適値の下限を知ることができると、終止条件として用いることができるため実用上有用である。また、各反復においてつねに $l_{k} \leq f (𝐱^{*}) \leq f (𝐱_{k})$ が成立するため、近似の精度を効率的にみつもることができる。

このテンプレート:仮リンク、すなわち $f (𝐱_{k})$ と $l_{k}$ との差も同一の収束速度で減少すること、つまり $f (𝐱_{k}) - l_{k} = O (1 / k)$ が成立することが知られている。

脚注

テンプレート:脚注ヘルプテンプレート:Reflist

参考文献

外部リンク

テンプレート:最適化アルゴリズム

[1] テンプレート:Cite journal

[2] テンプレート:Cite journal

[3] テンプレート:Cite journal

[4] テンプレート:Cite journal

[5] テンプレート:Cite journal

[6] テンプレート:Cite book

[1]

[2]

[3]

[4]

[5]

[6]

フランク・ウルフのアルゴリズム

目次

問題定義

アルゴリズム

性質

解の値の下限と主双対解析

脚注

参考文献

関連項目

外部リンク

ナビゲーションメニュー

フランク・ウルフのアルゴリズム

問題定義

アルゴリズム

性質

解の値の下限と主双対解析

脚注

参考文献

関連項目

外部リンク

ナビゲーション メニュー

検索

ナビゲーションメニュー