「インスタンス・セグメンテーションとはどのような技術なのか」と疑問を持つ方も多いでしょう。
インスタンス・セグメンテーションは深層学習・コンピュータビジョンの分野で注目されている画像認識技術のひとつです。
この記事では、インスタンス・セグメンテーションの意味・仕組み・手法・活用場面をわかりやすく解説していきます。
インスタンス・セグメンテーションの定義と結論
それではまず、インスタンス・セグメンテーションの定義と結論から解説していきます。
インスタンス・セグメンテーションとは、画像内の各オブジェクトをピクセル単位で識別し、同じクラスの複数オブジェクトをそれぞれ個別に区別する技術です。
物体検出とセマンティック・セグメンテーションの両方の性質を持ちます。
インスタンス・セグメンテーション=クラス識別+個体識別。「人物A・人物B・人物C」のように同クラス内の個別オブジェクトを区別できます。
セマンティック・セグメンテーションとの違い
続いては、セマンティック・セグメンテーションとインスタンス・セグメンテーションの違いを確認していきます。
| 手法 | 特徴 | 同クラス個体の区別 |
|---|---|---|
| セマンティック・セグメンテーション | ピクセルをクラスに分類 | 区別しない |
| インスタンス・セグメンテーション | 個々のオブジェクトを個別識別 | 区別する |
| パノプティック・セグメンテーション | 両手法を統合 | 区別する |
セマンティック・セグメンテーションでは「すべての人物ピクセルを同じ色で塗る」のに対し、インスタンス・セグメンテーションでは「人物Aを赤・人物Bを青・人物Cを緑」のように個別に識別するでしょう。
代表的な手法:Mask R-CNN
インスタンス・セグメンテーションの代表的な手法として「Mask R-CNN」が知られています。
Facebook AI Research(FAIR)が2017年に発表したMask R-CNNは、Faster R-CNNにセグメンテーションマスク予測ブランチを追加した構造で、物体検出とピクセル単位のマスク生成を同時に行えます。
その後もYOLACT・SOLOなど多数の改良手法が提案されています。
深層学習による特徴抽出の仕組み
インスタンス・セグメンテーションモデルは畳み込みニューラルネットワーク(CNN)を使って画像から特徴マップを抽出し、バウンディングボックス検出とピクセルマスク生成を同時に学習します。
大量の注釈付き学習データ(ラベル付き画像)を使ってモデルを訓練することで、未見の画像に対しても高精度なセグメンテーションが可能となるでしょう。
計算コストが高いため、GPUを使った高速処理が重要な要件となります。
評価指標:mAP(平均適合率)
インスタンス・セグメンテーションの性能評価にはmAP(mean Average Precision)という指標が使われます。
COCOデータセット(Common Objects in Context)がベンチマークとして広く使用されており、論文での手法比較にも標準的に用いられているでしょう。
高いmAPスコアが精度の高さを示します。
インスタンス・セグメンテーションの応用分野
続いては、インスタンス・セグメンテーションの主な応用分野を確認していきます。
自動運転・ロボット分野
自動運転では歩行者・車両・障害物を個別に識別して安全な走行制御を行うためにインスタンス・セグメンテーションが活用されています。
ロボットによる物品の把持・仕分け作業においても、個別のオブジェクトをピクセル単位で認識する技術は不可欠でしょう。
精度と処理速度の両方が要求される分野です。
医療画像分析
医療分野ではCT・MRI・病理画像中の腫瘍・細胞・病変部位を個別に検出・輪郭抽出するためにインスタンス・セグメンテーションが活用されています。
個々の細胞や病変を正確に識別することで、診断支援・治療計画立案の精度向上が期待されるでしょう。
医療AIとして実用化が進んでいる分野のひとつです。
農業・工場検査分野
農業分野では果実・野菜の個別識別・収穫量推定にインスタンス・セグメンテーションが活用されています。
工場の製品検査では不良品・正常品を個別に識別して品質管理の自動化を実現するケースもあるでしょう。
産業分野でのAI活用において重要な技術となっています。
まとめ
インスタンス・セグメンテーションは画像内の各オブジェクトをピクセル単位で識別しながら同クラスの複数個体を個別に区別する技術です。
Mask R-CNNに代表される深層学習ベースの手法が主流であり、自動運転・医療・農業・工場検査など様々な分野で実用化が進んでいます。
セマンティック・セグメンテーションと組み合わせたパノプティック・セグメンテーションなど、さらに高度な技術も発展しているでしょう。
コンピュータビジョンの最前線技術として今後もますます重要な役割を担っていきます。