【E資格不合格から学ぶ】Faster RーCNN(物体検出)のポイントを解説!

  • 「Faster RーCNN」について学びたいけど理解できるか不安・・・
  • 「Faster RーCNN」を使うメリットが分からない?
  • 「Faster RーCNN」を体系的に教えて!

 「Faster RーCNN」は、RPN(Region Proposal Network)という物体候補領域の提案の処理にCNNを使用したものを使い、ほぼリアルタイムで動作し「動画認識」への応用される物体検出モデルですが、興味があってもよく理解できないケースが非常に多いです。

 私は過去に基本情報技術者試験(旧:第二種情報処理技術者試験)に合格し、また2年程前に「一般社団法人 日本ディープラーニング協会」が主催の「G検定試験」に合格しました。現在、「E資格」にチャレンジ中ですが3回不合格になり、この経験から学習の要点について学ぶ機会がありました。  

 そこでこの記事では、「Faster RーCNN」を学習する際のポイントについて解説します。

 この記事を参考にして「Faster RーCNN」が理解できれば、E資格に合格できるはずです。

<<「Faster RーCNN」のポイントについて今すぐ見たい方はこちら

目次

1.Faster RーCNN 開発の背景

  • R-CNNは2段階検出器
  • 手順1:物体候補領域の提案
    Selective Search を使用しているため、処理速度が遅い
  • 手順2:提案された候補領域における物体のクラス分類
    Fast-R-CNNでは改良されたものの、手順1には Selective Search を使用→ 画像1枚の処理時間は、パート1:1秒、パート2:0.22秒
上記課題の解決策
  • 高速な処理を行う手法を提案⇒ Faster RーCNN
  • Faster RーCNN
    リアルタイム(動画など)処理が可能

2.Faster RーCNN のアイデア

「Faster RーCNN」のアイデアとは・・・
  • 「RPN(Region Proposal Network)」を提案
    RPNはCNN(畳み込みニューラルネットワーク)の一種
  • 「RPN」を物体候補領域の提案の処理に使用
    特徴抽出~カテゴリ推定をEndーto-End(一気通貫)な学習が可能になる
  • Region Proposal を直訳 ⇒「地域提案」

Endーto-Endな学習とは・・・
 1つの問題やタスクに対して、ネットワーク中の入力層(端)から出力層(端)
までの全層の重みを、1度に学習することをいう。

引用元:「CVMLエキスパートガイド

2.1 RPN(Region Proposal Network)

RPN(Region Proposal Network)とは・・・
  • 特徴マップ
    入力画像VGG16により特徴マップに変換
    補足)VGG16とは深さが16層のCNN(畳み込みニューラルネットワーク)
  • Anchors
    ・矩形領域回帰の誤差関数
    ・特徴マップに 「Anchor Points」 を仮想
     「Point」ごとに 「Anchor Boxes」 を作成する
    ・Anchor Points の個数:H × W
    ・1つの Anchor Point あたりの Anchor Boxes の個数:S
    ・Anchor Boxes の個数:H×W×S
  • RPNの出力
    ・各「Anchor Boxes」を「Grand Truth」の「Boxes」と比較し、含まれているものが背景か物体か、どれくらいズレているか出力
    ・各「Anchor Boxes」において背景か物体か:H×W×S×2
    ・各「Anchor Boxes」において正解 Boxes とのズレ
     (中心座標(x、y),縦,横):H×W×S×4
RPNの出力イメージ
RPNの出力イメージ

2.2 RoI Pooling

RoI Poolingとは・・・
  • Fast/Faster R-CNN ではRoI Pooling(関心領域プーリング)」 を使用
  • 畳み込み処理後の特徴マップから、Region proposal領域を「固定サイズの特徴マップ」として抽出
    ※前段の畳み込み処理を共通化できて、高速化を実現した要因の1つ
  • 特徴マップ上で固定サイズの特徴ベクトルを切り出す際に、少数を切り捨てるなどの操作をし、情報が粗く離散化されて欠落してしまうため、高精度の推定が難しい
RoI Poolingの説明図
RoI Poolingの説明図

2.3 R-CNN と Fast R-CNN と Faster R-CNN の比較

R-CNNFast R-CNNFaster R-CNN
物体候補領域の提案Selective SearchSelective SearchRegion Proposal Network
提案された候補領域
における物体のクラス分類
線形サポートベクターマシンRoI PoolingRoI Pooling
R-CNN と Fast R-CNN と Faster R-CNN の比較

3.まとめ

【Faster RーCNN の特徴】
  • 入力画像からCNNで特徴マップを得る
  • Region Proposal Network
    ・物体候補領域の提案に採用
    ・高速処理を実現し、End-To-Endなネットワークを可能にした

最後まで読んで頂きありがとうございます。
皆様のキャリアアップを応援しています!!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次