【E資格不合格から学ぶ】MAML(メタ学習)の3つのポイントを徹底解説!

  • 「MAML(メタ学習)」について学びたいけど理解できるか不安・・・
  • 「MAML(メタ学習)」についてどこから学んでいいか分からない?
  • 「MAML(メタ学習)」の特徴を分かりやすく教えて!

 「メタ学習」とは様々なタスクを解くことができる汎用的な単一モデルを訓練することを目的とした学習手法です。「MAML(Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks)」は、そのメタ学習手法の1つであり少ない訓練データで高い精度を実現するモデルですが、興味があっても難しそうで何から学んだらよいか分からず、勉強のやる気を失うケースは非常に多いです。

 私は過去に基本情報技術者試験(旧:第二種情報処理技術者試験)に合格し、また2年程前に「一般社団法人 日本ディープラーニング協会」が主催の「G検定試験」に合格しました。現在、「E資格」にチャレンジ中ですが3回不合格になり、この経験から学習の要点について学ぶ機会がありました。 

 そこで、この記事では「MAML(メタ学習)」のポイントを解説します。

 この記事を参考に「MAML」が理解できれば、E資格に合格できるはずです。

<<「MAML(メタ学習)」のポイントについて今すぐ見たい方はこちら

目次

1.「メタ学習」が解決したい課題

「メタ学習」とは・・・
  • 様々なタスクを解くことができる汎用的な単一モデルを訓練することを目的とした学習手法
  • 深層学習モデルの開発に必要なデータ量を削減したい。
データセット名画像の枚数
MNIST7万枚
ImageNet
(ILSVRC2012)
約120万枚
Open Image Dataset
V6
約900万枚
MegaFace約570万枚
深層学習モデル開発に必要なデータ量
  • 訓練に必要なデータ量が多い
    ・人手のアノテーションコスト
    ・データ自体を準備できるかどうか
  • 少ないデータの問題点
    過学習が発生しやすい
    ⇒少ないデータで学習させたい

2.「MAML」の構想

「MAML」の構想
  • MAML(Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks)
  • タスクに共通する重みを学習し、新しいモデルの学習に活用 ⇒ よい初期値を探索

事前学習

代表的なモデル開発の手順
代表的なモデル開発の手順
MAMLのコンセプト

3.学習手順

学習手順
  • タスクごとの学習結果を共通重みに反映させ学習
MAMLの学習手順
MAMLの学習手順
アルゴリズム
  • 下記のアルゴリズムにより、θのよい初期値を探索
パラメータθの更新式
パラメータθの更新式

確率的勾配降下法とは・・・
  (t+1)=w(t) ー εΔEn

4.「MAML」の効果

  • メタ学習は「Few-Shot learning 」によって汎化性能を測ることが多い。
    Few-Shot learning :数個の訓練データのみ学習して新しいタスクを解く学習手法。
     具体的には何のタスクかを指定した後、2つ以上の例を教え、その後推論する。
  • Few-Shot learning で既存手法を上回る精度を実現
    Omniglotデータセット(50種類の文字)を使ったクラス分類
  • 回帰問題強化学習などでも効果が確認された。
  • 下表はMAMLと他のFewーshot learning手法でAccuracy(正解率)を比較した結果を表したものである。下表より、MAML(ours)が他のFew-Shot learningよりAccuracy(正解率)が高いことが確認できる。
    出典:C. Finn+,arXiv:1703.03400
MAMLと他のFewーshot learning手法でAccuracy(正解率)を比較した表
MAMLと他のFewーshot learning手法でAccuracy(正解率)を比較した表

  

5.「MAML」の課題と対処

課題
  • 計算量が多い
    タスクごとの勾配計算と共通パラメータの勾配計算の2回が必要
    ・実用的にはInner loop のステップ数を大きくできない

対処
  • 計算コストを削減する改良案(近似方法)
    Firstーorder MAML:2次以上の勾配を無視し計算コストを大幅低減
    Reptile:Inner loopの逆伝播を行わず、学習前後のパラメータの差を利用

6.まとめ

【MAMLの特徴】
  • 回帰問題、強化学習などでも効果が確認された。
  • 目的関数を最小化するような全体のパラメータを確率的勾配降下法を用い更新
    タスクごとの勾配計算と共通パラメータの勾配計算の2回が必要
  • MAML(ours)のAccuracy(正解率)は5ーshot・5-wayが最も高い。

最後まで読んで頂きありがとうございます。
皆様のキャリアアップを応援しています!!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次