教師なし学習

提供: testwiki
2024年5月28日 (火) 18:11時点における240d:1a:3ce:c00:4ce7:76b:ec56:fe14 (トーク)による版
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

テンプレート:Expand English テンプレート:Machine learning bar 教師なし学習(きょうしなしがくしゅう, テンプレート:Lang-en-short)とは、機械学習の手法の一つである。

既知の「問題」テンプレート:Mvarに対する「解答」テンプレート:Mvarを「教師」が教えてくれる手法である教師あり学習、と対比して「問題」テンプレート:Mvarに対する「出力すべきもの(正解=教師)」があらかじめ決まっていないという点で教師なし学習と呼ばれ、データの背後に存在する本質的な構造を抽出するために用いられる。

概要

教師なし学習は教師あり学習と違い、目的変数テンプレート:Mvarに相当するものがそもそも存在しないか、あっても知る事ができない。未知の確率分布p(𝐱)に従う変数𝐱1,,𝐱nが訓練データとしてアルゴリズムに与えられる。アルゴリズムが解くべきタスクは、確率分布p(𝐱)やその重要な性質を何らかの形で学習し、p(𝐱)の特性を直接推定する事である[1]。教師あり学習と違い、明確な「正解」テンプレート:Mvarが存在しないので、教師なし学習では出力の妥当性を直接評価する評価尺度は存在せず[1]、妥当か否かの判断は主観的なものになり[1]、ヒューリスティックな議論が必要となる[1]

教師なし学習の興味の一つは確率密度関数p(𝐱)それ自身を推定する密度推定のタスクであり、カーネル密度推定など統計学で様々なノンパラメトリック密度推定の手法が知られている[1]。しかしテンプレート:Mvarの次元が高い場合は次元の呪いが原因でこうした推定はうまくいかず[1]、それゆえ多くの教師なし学習では、p(𝐱)の何らかのパラメトリックなモデルでp(𝐱)を近似することを試みたり、訓練データからp(𝐱)の何らかの重要な性質を抽出するといったアプローチが取られる。


具体的なタスクとして以下のようなものがある。

アルゴリズム

テンプレート:節stub

自己教師あり学習

自己教師あり学習テンプレート:Lang-en-short)は学習データのラベルを学習データに基づいて生成する学習手法である[2]。教師ラベルがないという点で教師なし学習の一種とみなせる[3]

脚注

テンプレート:Reflist

参考文献

テンプレート:Refbegin

テンプレート:Refend

テンプレート:統計学 テンプレート:Comp-stub

テンプレート:Normdaten

  1. 1.0 1.1 1.2 1.3 1.4 1.5 #ESL p559-561
  2. "Obtain 'labels' from the data itself by using a “semiautomatic” process." Liu, et al. (2021). Self-supervised Learning: Generative or Contrastive. p.2.
  3. "Self-supervised learning can be viewed as a branch of unsupervised learning since there is no manual label involved." Liu, et al. (2021). Self-supervised Learning: Generative or Contrastive. p.2.