■ イネウンカAI自動カウントシステム− 表2注)2019年と2020年に九州沖縄農業研究センターの水田で粘着板払い落し法によってイネウンカ類を付着させた調査用粘着板の画像を学習させた物体検出モデルに、他地域の水田で同様にイネウンカ類を付着させた調査用粘着板の画像を認識させた際の適合率(適合率=[真に正であったもの]/[正と認識したもの])を示しています(ただし、ヒメトビウンカの短翅型オスの発生は極めて少なく、他地域の水田では捕獲されなかったため、計算から除外しています)。水田の害虫ウンカの発生量を調べるためのカウントシステムの開発適合率(%)99.697.597.292.997.096.299.699.788.098.495.697.360.572.583.268.995.790.696.6作成した物体検出モデルの認識精度(適合率)トビイロウンカの長翅型メストビイロウンカの長翅型オストビイロウンカの短翅型メストビイロウンカの短翅型オストビイロウンカの老齢幼虫トビイロウンカの中齢幼虫セジロウンカの長翅型メスセジロウンカの長翅型オスセジロウンカの短翅型メスセジロウンカの老齢幼虫セジロウンカの中齢幼虫ヒメトビウンカの長翅型メスヒメトビウンカの長翅型オスヒメトビウンカの短翅型メスヒメトビウンカの短翅型オスヒメトビウンカの老齢幼虫ヒメトビウンカの中齢幼虫若齢幼虫(トビイロ、セジロ、ヒメトビウンカを含む)全クラスの平均トビイロウンカに関するクラス(若齢幼虫も含む)の平均クラスNARO Technical Report /No.17/202516 現在では、深層学習による画像認識は、人間が見分けることのできるものであれば、人間が行うのと同等の精度で見分けることができると考えられるまでになりましたが、既に十分な量を学習したものでなければ見分けられないという大きな欠点があります。前述のような利用可能な既存のデータセットにはイネウンカ類の画像は含まれていないので、イネウンカ類を画像認識で見分けるためには自前でイネウンカ類の画像を準備し、それらを学習用画像としてラベル付け(アノテーション)する必要がありました。さらに、画像収集に向けられる人的資源は有限なため、イネウンカ類の画像であれば何でも良いというわけではなく、効率よく画像収集を行う必要もあります。最も効率的な方法は、完成版の自動識別・計数システムの運用時に行うのと同じ方法で学習用画像を取得し収集することですが、それは研究の最初の段階からシステム完成時の画像撮影方法を決めるということになります。なるべくコストをかけずに高精細な画像を安定して取得する方法について研究グループ内で議論を重ね試行錯誤した結果、水田のイネからイネウンカ類を叩き落として調査用粘着板に付着させ、その調査用粘着板をフラットベッドスキャナを用いて1,200dpiでスキャンするという方法を採用しました。こうして得られた画像中の各イネウンカ類の個体について、必要に応じて顕微鏡下で調査用粘着板上の実物とも見比べ、イネウンカ類の個体約37,000匹分を含む約16,000枚分の画像を300時間以上かけて可能な限り正確にアノテーションし、学習用画像データセットを作成しました。 こうして得られた学習用画像データセットを、高速な物体検出アルゴリズムとして知られるYOLO※6を用いて、転移学習により学習させました。転移学習とは、事前に別のデータで学習済みのモデルを利用して新たなデータを学習させるものです。YOLOでは大量の画像を事前学習済みのモデルが配布されているため、比較的少量の画像でも精度の高いモデルを構築することが期待できます。転移学習は、農研機構のAI用スーパーコンピューター「紫峰※7」を用いて行いました。作成した物体検出モデルは、調査用粘着板上に付着した昆虫や植物片から自動でイネウンカ類の個体だけを選り分け18クラスに分類し、その認識精度はクラス全体で約90%(最も甚大な被害をもたらすトビイロウンカでは95%以上の認識精度)に達しました(表2)。 このようにして作成した物体検出モデルですが、このままでは調査用粘着板の画像を認識させるために長いコマンド入力が必要なため実用的ではありません。そこで画像認識と認識結果の計数を行うプログラムを開発し、その中にこの物体検出モデルを組み込むことで自動化を行いました。この自動カウントプログラムでは、フラットベッドスキャナを用いてスキャンした調査用粘着板の画像を入力すると、その画像を適当な大きさに分割し、YOLOアルゴリズムで画像中のイネウンカ類を認識し、その結果を集計してCSVファイルとして出力するという一連の動作を自動的に行います(図3)。自動カウントプログラムは使用するコンピューターに合わせてLinux版とWindows版を作成しました。調査用粘着板1枚のスキャンに3〜4分程度かかり、モデルの実行と計数は30秒〜1分程度で終わります2)3)。 の開発
元のページ ../index.html#16