教師なし学習
テンプレート:Expand English テンプレート:Machine learning bar 教師なし学習(きょうしなしがくしゅう, テンプレート:Lang-en-short)とは、機械学習の手法の一つである。
既知の「問題」テンプレート:Mvarに対する「解答」テンプレート:Mvarを「教師」が教えてくれる手法である教師あり学習、と対比して「問題」テンプレート:Mvarに対する「出力すべきもの(正解=教師)」があらかじめ決まっていないという点で教師なし学習と呼ばれ、データの背後に存在する本質的な構造を抽出するために用いられる。
概要
教師なし学習は教師あり学習と違い、目的変数テンプレート:Mvarに相当するものがそもそも存在しないか、あっても知る事ができない。未知の確率分布に従う変数が訓練データとしてアルゴリズムに与えられる。アルゴリズムが解くべきタスクは、確率分布やその重要な性質を何らかの形で学習し、の特性を直接推定する事である[1]。教師あり学習と違い、明確な「正解」テンプレート:Mvarが存在しないので、教師なし学習では出力の妥当性を直接評価する評価尺度は存在せず[1]、妥当か否かの判断は主観的なものになり[1]、ヒューリスティックな議論が必要となる[1]。
教師なし学習の興味の一つは確率密度関数それ自身を推定する密度推定のタスクであり、カーネル密度推定など統計学で様々なノンパラメトリック密度推定の手法が知られている[1]。しかしテンプレート:Mvarの次元が高い場合は次元の呪いが原因でこうした推定はうまくいかず[1]、それゆえ多くの教師なし学習では、の何らかのパラメトリックなモデルでを近似することを試みたり、訓練データからの何らかの重要な性質を抽出するといったアプローチが取られる。
具体的なタスクとして以下のようなものがある。
アルゴリズム
自己教師あり学習
自己教師あり学習(テンプレート:Lang-en-short)は学習データのラベルを学習データに基づいて生成する学習手法である[2]。教師ラベルがないという点で教師なし学習の一種とみなせる[3]。
脚注
参考文献
- テンプレート:Cite book
- テンプレート:Cite web:上述の書籍の英語版公式サイト。無料pdfあり。
- ↑ 1.0 1.1 1.2 1.3 1.4 1.5 #ESL p559-561
- ↑ "Obtain 'labels' from the data itself by using a “semiautomatic” process." Liu, et al. (2021). Self-supervised Learning: Generative or Contrastive. p.2.
- ↑ "Self-supervised learning can be viewed as a branch of unsupervised learning since there is no manual label involved." Liu, et al. (2021). Self-supervised Learning: Generative or Contrastive. p.2.