【E資格不合格から学ぶ】ResNet（画像認識）とは？

2022年8月23日2024年10月30日

「ResNet」について学びたいけど理解できるか不安･･･
「ResNet」についてどこから学んでいいか分からない？
「ResNet」を体系的に教えて！

　「ResNet（Residual Net）」は、「Residual module」、「batch normalization」、「Heの初期化」を利用し、2015年にILSVRC（物体検出コンペティション）において優勝した深層学習モデルですが、興味があっても難しそうで何から学んだらよいか分からず、勉強のやる気を失うケースは非常に多いです。

　私は過去に基本情報技術者試験（旧：第二種情報処理技術者試験）に合格し、また2年程前に「一般社団法人日本ディープラーニング協会」が主催の「G検定試験」に合格しました。現在、「E資格」にチャレンジ中ですが３回不合格になり、この経験から学習の要点について学ぶ機会がありました。　

　そこでこの記事では、「ResNet」の学習のポイントを解説します。

この記事を参考にして「ResNet」が理解できれば、E資格に合格できるはずです。

<<「ResNet」のポイントを今すぐ見たい方はこちら

1.効率的な学習方法とは

効率的な学習をするために･･･

転移学習（Transfer Learning)
教師あり学習において、目的とするタスク（課題）での教師データが少ない場合に、別の目的で学習した学習済みモデルを再利用
「異なるドメイン（=領域）の学習結果」を利用

異なるドメインの学習結果を利用とは･･･

異なるドメイン（=領域）のデータで高精度の学習済みモデルがある場合･･･

そのモデルの構造は似たタスクでも有効ではないか？
学習済みモデルを別タスクでそのまま利用できるのではないか？
「事前学習」した情報から始めた方が学習が効率的になるのではないか？

「事前学習」の方法とは･･･

ImageNetは1400万件以上の写真のデータセット。
様々なAI/MLモデルの評価基準になっており、学習済みモデルも多く公開されている。
参照元：https://cs.stanford.edu/people/karpathy/cnnembed/

今回の事前学習で利用するモデル

ImageNetを1000分類で分類した教師データを利用。
ResNetにより学習。以下はサンプル

No.	Index	Label
1	0	tench, Tinca tinca
2	1	goldfish, Carassius auratus
3	2	great white shark, white shark, man-eater, man-eating shark, Carcharodon carcharias
4	3	tiger shark, Galeoceydo cuvieri
5	4	hammerhead, hammerhead shark

ImageNetの教師データの例

ImageNet学習済みモデルの概要（ResNet抜粋）

No.	Model	Size	Top-1 Acc	Params
1	ResNet50	98MB	0.749	25,636,712
2	ResNet101	171MB	0.764	44,707,176
3	ResNet152	232MB	0.766	60,419,944

ImageNet学習済みモデルの概要（ResNet抜粋）

参照元：https://keras.io/api/applications/

2.ResNet

「ResNet」とは･･･

「Residual Net」のこと
Residual：直訳すると「残留物」
【工夫】「Skip Connection」＋「Bottleneck構造」を導入
メリット
勾配消失問題の回避
勾配爆発の回避
2015年にILSVRC（物体検出コンペティション）において優勝
【分類誤差】3.6%

2.1 Skip Connection

出典元:https://arxiv.org/pdf/1512.03385v1.pdf

深い層の積み重ねでも学習可能に
◦勾配消失問題の回避
◦勾配爆発の回避
中間層の部分出力：H(x)
残差ブロック(Residual Block)：
H(x)＝F(x)＋x
学習部分：F(x)

Skip Connection：上図よりバイパス接続（=Identity ｍapping）をすること。
Identity ｍapping：日本語に直訳すると「身元の位置付けを割り当てる」

「Residual Block」導入によるメリット

ブロックへの入力にこれ以上の変換が必要ない場合は重みが0となる。
⇒ 浅いCNN(畳み込みニューラルネットワーク)で十分学習ができてしまい、深い中間層が不要な際、不要な層の重みが０になる。
小さな変換が求められる場合は対応する小さな変動をより見つけやすくなる。
入力時点の勾配が小さい値の場合、通常であればレイヤーを重ねていくほど勾配が消失していってしまうが、「Skip Connection」によりわずかな勾配の情報を消失することなく残すことができる。
⇒ 層を深くしても学習を進めることが可能