逐次最小問題最適化法

テンプレート:Infobox algorithm 逐次最小問題最適化法（テンプレート:Lang-en-short, SMO）はサポートベクターマシン (SVM) の訓練で生じる2次計画問題 (QP) を解くためのアルゴリズムである。1998年にマイクロソフトリサーチのテンプレート:仮リンクによって発明された^[1]。SMOはサポートベクターマシンの訓練のために広く使われ、人気のLIBSVMツールによって実装される^[2]^[3]。以前から利用できたSVM訓練法はより一層複雑で、高価なサードパーティーのQPソルバーを必要としたので、1998年のSMOアルゴリズムの公表はSVMコミュニティでたくさんの興奮を引き起こした^[4]。

最適化問題

テンプレート:Main データセット (x₁, y₁), ..., (x_n, y_n) に関する二項分類問題を考える。ここで x_i は入力ベクトル、テンプレート:Nobrはそれに対応する2値ラベルである。ソフトマージンサポートベクターマシンは以下の双対問題で表される2次計画問題を解くことによって訓練される: テンプレート:Indent テンプレート:Indent テンプレート:Indent テンプレート:Indent ここで C は SVM hyperparameter、K(x_i, x_j) はテンプレート:仮リンクで、どちらもユーザが与える。変数 $α_{i}$ はラグランジュ乗数である。

アルゴリズム

SMOは上記の最適化問題を解くための反復型アルゴリズムである。SMOはこの問題をその時解析的に解かれる一連の最小の可能な部分問題に分割する。ラグランジュ乗数 $α_{i}$ を伴う線形等式制約のため、最小の可能な問題はそのような2つの乗数を含む。そして、任意の2つの乗数 $α_{1}$ 、 $α_{2}$ について、次の制約に分解される: テンプレート:Indent テンプレート:Indent $k$ は前述の和の等式より導かれる定数である。そしてこの問題は解析的に解くことができる。

アルゴリズムは次のように進行する:

最適化問題のKKT条件を破るラグランジュ乗数 $α_{1}$ を見つける。
第2の乗数 $α_{2}$ を選び、組 $(α_{1}, α_{2})$ を最適化する。
収束するまでステップ1、2を繰り返す。

すべてのラグランジュ乗数がKKT条件を十分に満たすとき、全体の最適化が終了する。このアルゴリズムは収束することが保証されている。しかし、データセットが大きくなると、組 $(α_{1}, α_{2})$ の選び方が $O (n^{2})$ で大きくなるので、より速く収束させるために、部分問題を構成する変数を選び出すためのヒューリスティックを使うことが重要となる。

参考文献

テンプレート:Reflist

[1] テンプレート:Citation

[2] テンプレート:Cite journal

[3] Luca Zanni (2006). Parallel Software for Training Large Scale Support Vector Machines on Multiprocessor Systems.

[4] テンプレート:Citation

[1]

[2]

[3]

[4]

逐次最小問題最適化法

目次

最適化問題

アルゴリズム

関連項目

参考文献

ナビゲーションメニュー

逐次最小問題最適化法

最適化問題

アルゴリズム

関連項目

参考文献

ナビゲーション メニュー

検索

ナビゲーションメニュー