プレスリリース
(研究成果) 国内初の農業特化型生成AIを開発

- 全国展開を目指した試験運用を三重県で開始 -

情報公開日:2024年10月18日 (金曜日)

ポイント

農研機構は、農業知識を学習させた生成AI1)を開発し、10月21日より三重県で試験運用を開始します。農業分野に特化した生成AIとして初となります。インターネット上の公開情報だけでなく、全国の農業機関に呼びかけてデータ収集した生産現場の栽培技術や農研機構が強みとする専門的な栽培知識を用いて追加学習を行った点に特徴があります。今後は全国各地に生成AIを展開し、現場からのフィードバックを得て継続的に精度を向上させることで新規就農者の早期育成、既存農業者への新技術提供を通して農業者の知識習得を支援し、農業の持続的な発展に貢献していきます。

概要

本年6月に食料・農業・農村基本法が25年ぶりに改正され、不安定化する世界情勢の中で食料の安定供給に向け、スマート農業を強力に促進していくことが求められています。一方、我が国の基幹的農業従事者の平均年齢は68.7歳(2023年)と高齢であり、農業者数は今後20年間で30万人まで減少するという予測も立てられています。したがって、新規就農者の早期育成に向けた知識習得と既存農業者への最新農業技術の提供が急務となっています。

現在、さまざまな分野で生成AIの活用が検討されていますが、汎用的な生成AIでは専門的な知識に関する質問では誤回答が多くみられます。そこで、広く公開されているインターネット上の農業情報に留まらず、農研機構に蓄積された研究データを始め、地方公共団体の公設試験研究機関(公設試)やJA等が持つ栽培マニュアルや栽培暦、営農指導記録等、一般には手に入らない専門的な情報を用い、日本特有の栽培知識、例えば同じ作目であっても品種ごとに異なる特性や、日本国内でも地域ごとの土壌や気象条件に応じた栽培方法の違い、農業者による消費者への細やかな配慮など、精緻なデータを大量に学習させました。その結果、農業の専門的な知識に関する質問に対して本生成AIは汎用的な生成AIに比べて正答率2)が40%高いことが示されました。農業分野に特化した生成AIの開発事例としては我が国初となります。

この度、10月21日から三重県でイチゴを対象とした本生成AIの試験運用を開始することになりました。生成AIをチャットツールと組み合わせて三重県の普及指導員3)に提供します。農研機構は、他作目向け生成AIも開発し、普及指導員のオフィス等での調査時間を3割削減し、農業者への高度な普及指導への対応を可能とすることを目指します。

今後も農研機構が中心となり、全国の普及指導センターをはじめ公設試や農業法人、スタートアップなどと連携の輪を拡げ、農業現場を変革すべく農業データの集積と生成AIの展開を進めていきます。これらの活動を通じて、普及指導員や農業者から生成AIによって提供された回答の正誤や使い勝手などの情報を収集し、継続的に生成AIの精度を高めていきます。新規就農者を含む農業者等があらゆる場面において、生成AIを活用した技術指導等を簡単に受けられるようにすることで、普及指導員を通じてより高度な指導を受けられる環境を整え、担い手育成など農業の持続的発展に貢献していきます。

図1.生産現場での利用を通した農業用生成AIの開発と全国展開

関連情報

予算 : 研究開発とSociety5.0との橋渡しプログラム(BRIDGE)「AI農業社会実装プロジェクト」および「生成AIを活用した食料の安定供給」

問い合わせ先など
研究推進責任者 :
農研機構 理事 兼 基盤技術研究本部 本部長中川路 哲男
同 基盤技術研究本部 農業情報研究センター センター長村上 則幸
副センター長川村 隆浩
研究担当者 :
同 基盤技術研究本部 農業情報研究センター データ研究推進室 上級研究員桂樹 哲雄
主任研究員小林 暁雄
北海道大学 大学院情報科学研究院 准教授坂地 泰紀
キーウェアソリューションズ株式会社 先端ソリューション企画本部 本部長吉村 和晃
三重県農業研究所 生産技術研究室野菜園芸研究課 主幹研究員兼課長近藤 宏哉
主任研究員杉村 安都武
株式会社ソフトビル 代表取締役緒方 良
株式会社ファーム・アライアンス・マネジメント 代表取締役松本 武
広報担当者 :
農研機構 基盤技術研究本部 研究推進室 室長西川 智太郎

詳細情報

開発の社会的背景と研究の経緯

昨今の不安定化する世界情勢の中で国内における食料の安定供給を維持するため、2024年の通常国会において農政の憲法と言われる食料・農業・農村基本法が25年ぶりに改正されました。併せて、スマート農業を振興する新たな法的枠組みも制定され、スマート農業に関する新技術を普及させ、生産・流通・販売方式の変革などの取り組みを強力に促進していくことが定められました。さらに、みどりの食料システム戦略に基づく気候変動等に対応した新技術など、昨今、次々と新しい農業技術が生まれています。一方、我が国の基幹的農業従事者は平均年齢68.7歳(2023年)と高齢であり、新規就農者が毎年4.3万人(2023年)程度参入してきているものの、基幹的農業従事者は今後20年間で116万人(2023年)から30万人まで減少するという予測も立てられています。これらの背景により、新規就農者の早期育成に向けた知識習得と既存農業者への最新の農業知識の提供を推進することが急務となっています。そのため、地域の特性に応じた農業に関する正確な知識と、スマート農業や気候変動等に対応した新技術情報等を収集・整理し、状況に応じてそれらを適切に引き出せる革新的新技術として生成AIの活用に注目しました。

研究の内容・意義

農研機構は北海道大学、キーウェアソリューションズ株式会社、三重県農業研究所、株式会社ソフトビル、株式会社ファーム・アライアンス・マネジメントと連携し、内閣府の「研究開発とSociety5.0との橋渡しプログラム(BRIDGE)」の支援を受けて、日本の各産地や作目に応じた精緻な農業知識を大量に学習させた生成AI(今回は文章情報に特化した大規模言語モデル)を開発しました。農業分野では我が国初の特化型生成AIとなります。これにより、農業者や普及指導員が最新農業知識を簡単に習得することができるようになります。

現在、各分野において生成AIを活用した業務効率化が試みられていますが、生成AIが事実とは異なる情報を提供するハルシネーション(幻覚の意。AIが事実に基づかない情報を生成する現象)と呼ばれる現象が問題視されています。ハルシネーションを抑えるには、生成AIに正確な知識を大量に学習させることが最も重要です。そのため、本生成AIの開発にあたっては、農林水産省と連携し、全国の公設試験研究機関(公設試)や農業法人等との協力の下、農研機構内外から農業に関する大量の知識(1000万トークン4)超)を収集しました。農研機構は研究データや、加工済みの公開データ、農業技術事典NAROPEDIA(https://lib.ruralnet.or.jp/nrpd/)、2019年から全国217カ所で実施しているスマート農業実証プロジェクトで得られたスマート農業関係のデータ、病害虫画像データ等を所有しています。本生成AIの開発においては、それらのデータに加えて、地方公共団体の公設試やJA等が持つ栽培マニュアルや栽培暦、営農指導記録等の情報を収集し、それらを学習用データとして用いました。本生成AIは事前学習済み日本語大規模言語モデル(Llama-3-ELYZA-JP-8B)をベースに、農研機構らが独自に継続事前学習と質問応答に関するファインチューニングを行い、検索拡張生成(RAG5))を適用したものです。さらに、複数の生成AIを組み合わせる最新の技術(MoA6))も導入しました。なお、学習データとしての利用に関しては、いずれもデータ所有者から承諾を得ています。そして、これら農業に特化した正確なデータを農研機構のAIスパコン「紫峰」7)で学習することで、インターネット上の情報のみを用いて学習した汎用的な事前学習済みベースモデル(Open AIのChatGPTやGoogleのGeminiなど)よりも、農業情報に関するハルシネーションを大幅に減らすことが可能になりました。今回、農業者から普及指導員への質問頻度の高い質問集(農作物の栽培や病虫害など)を作成し、生成AIからの回答を普及指導員が模範解答と比較して評価しました。その結果、農研機構の生成AIは汎用的な生成AIに比べて正答率が40%高いことが示されました。

本プロジェクトは2023年秋にスタートしましたが、この度10月21日から、三重県で第一弾となる本生成AIのイチゴを対象とした試験運用を開始することになりました。試験運用では、生成AIを農業者向けチャットツールと組み合わせて野菜担当の普及指導員に提供します。農研機構は、他作目向け生成AIも開発し、普及指導員のオフィス等での調査時間を3割削減し、農業者への高度な普及指導への対応を可能とすることを目指します。

図2.農業用生成AIの位置づけ
図3.農業用生成AIとの対話例(2024.9.11時点)

今後の予定・期待

生成AIの社会実装にあたってはデータの量と質が非常に重要です。農研機構は今後も全国の各産地と協力し、農業データのさらなる収集を進め、農業用生成AIの開発を進めていきます。また、機構内に構築した生成AIのAPI8)農業データ連携基盤WAGRI9)を介して提供していきます。WAGRIとは、農業に関するさまざまなデータを提供しているクラウドサービスです。WAGRI利用会員にはチャットアプリを提供している企業もおり、それら企業が今回の生成AIのAPIを自社のアプリに組み込むことで、今後は農業者等に対して生成AIを活用したサービスを提供していきます。農業の現場で実際に普及指導員や農業者に使ってもらい、生成AIによって提供された回答の正誤や使い勝手などの情報を収集し、今後も継続的に生成AIの精度を高めていきます。新規就農者を含む農業者や普及指導員が生成AIを活用した知識を得られるようにすることで、普及指導員を通じてより高度な技術指導を受けられる環境を整備し、担い手育成など農業の持続的発展に貢献していきます。

同時に、農業ICT企業の新サービス開発、新ビジネス創出に繋がり、サービス事業体等によるスマート農業の普及加速を期待しています。なお、今後、農研機構では農業分野に留まらず、食品分野においても生成AIを活用した食のデジタルデザインを進めていく予定です。

用語の解説

生成AI
深層学習を用いてテキスト、画像、音楽、ビデオ等のコンテンツを自動的に生成するAIの総称。大量のデータからパターンを学習し、人間が作ったような文章や絵を創り出す。[ポイントへ戻る]
正答率
三重県の普及指導員より農業者からよく聞かれる質問として提供された120問について、それらへの生成AIの回答を正確性や充足性などいくつかの観点から複数名で評価したもの。[概要へ戻る]
普及指導員
生産者に直接、農業技術の指導や経営相談、広く情報提供等を行うことで、生産者を支援する都道府県の職員。農業改良助長法に基づく国家資格。[概要へ戻る]
トークン
テキストデータを単語や句読点、記号などに分けたもの。学習データの最小単位。[研究の内容・意義へ戻る]
RAG(Retrieval Augmented Generation)
生成AIが回答を作成する際に、外部データを検索することで回答精度を向上させる技術。[研究の内容・意義へ戻る]
MoA(Mixture-of-Agents)
複数の生成AIを組み合わせ、それぞれの特徴を活かして回答精度を向上させる技術。[研究の内容・意義へ戻る]
AIスパコン「紫峰」
農研機構が2020年に整備したAI計算に特化したスーパーコンピューター。[研究の内容・意義へ戻る]
API
Application Programming Interfaceの略。ソフトウェア同士が情報をやりとりするための仕組み。[今後の予定・期待へ戻る]
農業データ連携基盤WAGRI
2019年から農研機構が運営する、クラウド上で農業データを提供しているサービス。2024年3月時点で100を超える民間企業等が利用している(https://wagri.naro.go.jp/)。[今後の予定・期待へ戻る]