【E資格試験対策】SemanticｰSegmentation（Computer vision）のポイントを解説！

2022年9月8日2025年12月18日

　「Semantic-Segmentation（意味的領域分割）」とはコンピュータビジョンの一分野であり、画像に対して画素（pixel）レベルでクラスを予測する分類タスクです。自動運転や医療画像の分野において重要な技術でありますが、よく理解できないケースが非常に多いです。

　私は過去に基本情報技術者試験（旧：第二種情報処理技術者試験）に合格し、また2年程前に「一般社団法人日本ディープラーニング協会」が主催の「G検定試験」に合格しました。現在、「E資格」にチャレンジ中ですが３回不合格になり、この経験から学習の要点について学ぶ機会がありました。　

　そこでこの記事では、「Semantic-Segmentation」を学習する際のポイントについて解説します。

　この記事を参考にして「Semantic-Segmentation」が理解できれば、E資格に合格できるはずです。

Deconvolution/Transposed-Convolution（逆畳み込み）

著者

Semantic-Segmentationの肝はUpｰsamplingをいかに行うかだよ

3×3 Conv.のみで同じ受容野を獲得しようとした場合
—–3×3 Conv.–･･･–3×3 Conv.→ 7個のConv.層が必要

「Semantic-Segmentation」の代表的なネットワーク構造として次のものがある。

【Semantic-Segmentationのポイント】

Deconvolution/Transposed-convolution（逆畳み込み）
畳み込みの逆演算ではないことに注意 → poolingで失われた情報が復元されるわけではない。
Dilated-Convolution（膨張畳み込み）
Convolutionの段階で受容野を広げる工夫
代表的なネットワーク構造
・FCN
・SegNet

最後まで読んで頂きありがとうございます。
皆様のキャリアアップを応援しています!!

よかったらシェアしてね！