シニアアプリケーションスペシャリストによる「技術トレンド情報」（第22回）ＡＩ技術について　その２コラム

公開日：2020年11月27日

前回、画像内から矩形領域で物体を検出する①物体検出（ClassNet）と、それに分類を加えた②物体分類（DeNet）を紹介いたしました。今回は、画素分類（SegNet）、3D認識（3DNet）について紹介いたします。ディープラーニングや、CNNについては前回コラム第21回をご覧ください。

画素分類「SegNet」について

前回ご紹介した物体検出（ClassNet）と物体分類（DeNet）では、画像内の対象物（人や車、製品や部品など）を矩形で検出するものでしたが、画素分類「SegNet」は、対象物を画素単位で検出します。

用途としては、局所的に不定形なキズや汚れの検出や、広範囲に不定形なムラなどの検出に適しています。学習時も、画像内のキズやムラに対して、それらを囲むように指定します。

図１のLED基板検査事例では、良品サンプル１２２枚、不良サンプル（６種類）３３８枚の画像を用いて、収束回数１４回^※1、学習時間３５分で実施しています。結果画像では、気泡や欠け、汚れの箇所を画素単位で検出していることがわかります。

図２の磁気リング検査事例では、良品サンプル４４枚、不良サンプル（３種類）１０８枚の画像を用いて、収束回数６回^※1、学習時間７分で実施した例です。結果画像では、研磨不良やキズの箇所を画素単位で検出しています。

※1
収束回数とは、与えられた画像で最大性能になるまでの学習回数を示します。

3D認識「3DNet」について

3D認識「3DNet」では、3D情報を基に対象物の姿勢を検出します。用途としては、ロボットピッキングや障害物検知など、2Dでは誤認識するようなケースでも、3D情報を活かし、物体の姿勢を高精度に検出します。技術的には、CADモデルまたは、実写画像サンプルから生成した３Dモデルを使用し、高速な3Dマッチングとトラッキング技術の組み合わせで構成されます。

図３では、2Dでは困難な複雑背景での検出例と、3D物体の陰になる場面での検出例を挙げています。

今回のまとめ

今回は、代表的な５つのCNN（畳み込みニューラルネットワーク）のうちの２つ「SegNet」と「3DNet」ついてご紹介いたしました。次回は、ロボット、AGV、ARグラスなどでも活用が進む、ポーズ認識「PoseNet」についてご紹介いたします。

筆者紹介

稲山一幸（いねやまかずゆき）エンジニアリング事業　シニアアプリケーションスペシャリスト

1992年住金制御エンジニアリング入社、Matrox社製品の国内総代理店立ち上げに参画、以降25年マシンビジョン業界に携わる。

2013年～2016年、キヤノン株式会社にてマシンビジョン関連の新製品開発のソフトウェアリーダとして従事。現在は、エバンジェリストとして活躍中。

メルマガ登録はこちら

製品に関するご相談はこちら

キヤノン製品・サポート情報

グループ企業情報

サイト内検索

Global Network

サイトメニュー

シニアアプリケーションスペシャリストによる「技術トレンド情報」（第22回）ＡＩ技術について　その２コラム

画素分類「SegNet」について

3D認識「3DNet」について

今回のまとめ

関連するソリューション・製品

シニアアプリケーションスペシャリストによる「技術トレンド情報」（第22回）ＡＩ技術について その２コラム

画素分類「SegNet」について

3D認識「3DNet」について

今回のまとめ

関連するソリューション・製品

シニアアプリケーションスペシャリストによる「技術トレンド情報」（第22回）ＡＩ技術について　その２コラム