転移学習を導入した深層ニューラルネットワークの洪水予測モデル

要約

人工知能の一種である深層ニューラルネットワークに転移学習の手法を適用した洪水予測モデルであり、高い予測精度と少ない計算コストの優位性を有する。過去の洪水データに対する再現計算においては、転移学習を適用することで予測精度が18%向上し、計算時間が1/5に削減できる。

  • キーワード:転移学習、深層ニューラルネットワーク、時系列データ、洪水予測
  • 担当:農村工学研究部門・水利工学研究領域・沿岸域水理ユニット
  • 代表連絡先:電話 029-838-7569
  • 分類:研究成果情報

背景・ねらい

近年急速に発達してきた人工知能の一種である深層ニューラルネットワークは、時系列データや画像解析の予測に効果を発揮しているが、予測精度の向上のためには大量データによる学習が必要であるうえ、学習の際に時間を要し計算コストが高価であることが課題である。これを解決する手法として、本来の予測対象とは別の類似する領域であらかじめ学習させたモデルを適用する手法である、転移学習が提案されている。本研究では、ある流域で発生する洪水の予測計算に対して、深層ニューラルネットワークモデルに、転移学習をカップリングして新たなモデルを構築する。このモデルの予測精度の向上と学習の計算時間の削減について、過去の洪水イベントを対象として定量的な評価を行う。

成果の内容・特徴

  • 過去30年間に多くの洪水イベントを経験した流域Aと洪水イベントが比較的少なかった流域Bを選定する。はじめに流域Aにおいて大量データ(43イベント)によるモデルの学習を実施し、流域Bの少量データ(17イベント)による転移学習を行う(図1)。
  • 本研究で利用する深層ニューラルネットワークは、画像解析で実績のある畳み込みニューラルネットワーク(Convolutional Neural Network、以後はCNNと略記)である。CNNは、画像のような2次元データの処理に優れ、様々な特徴を段階的に抽出することができる手法であり、学習によってデータの特徴を抽出する。転移学習は、あらかじめ学習済みのデータの特徴を利用する手法で、データの特徴抽出にかかる学習過程を省略できるため短時間の学習で且つ高精度な予測が可能である(図2)。
  • 洪水イベントを画像化する(図3)。洪水イベントは、観測点での時系列データであり、時間軸方向の線情報とみなすことができる。そこで、観測点における複数の時系列データを重ね合わせることで面情報を生成する。この面情報から切り出された小窓を入力情報の画像、予測する時系列の1時間後の値を出力値と定義し、1時間毎の相互の関係をデータセットとする。これらを、転移学習をカップリングしたCNNに入力し、学習と予測を行う。
  • 各流域の1~3番目までの大きな洪水イベントを除いて学習を行い、流域における過去最大の洪水イベントをテスト(予測)に、過去2-3番目に大きな洪水イベントと中規模イベントの4つのイベントをモデル精度の確認として検証を行う。定量評価手法は、平均平方二乗誤差(RMSE)を用いる。
  • 流域Bの過去最大の洪水イベントの予測において、流域Aで学習済みのCNN+転移学習(図2bの全結合層1-2のみを20回再学習)の予測精度はRMSE=0.12m、水位の変動幅に対する相対誤差は4.2%(図4b)、一方、CNN単独学習による予測精度はRMSE=0.15mである(図4a)。従って、転移学習の導入によって予測結果は約18%の精度向上となる。また計算時間は1/5に削減となる。

成果の活用面・留意点

  • CNN+転移学習は、他の流域でも洪水イベントの観測データがあれば適用可能である。

具体的データ

図1 2つの流域とモデルの再利用方法,図2 CNN構造とCNN+転移学習,図3 時系列データを画像に変換する方法,図4 洪水波形の予測結果

その他

  • 予算区分:交付金
  • 研究期間:2019年度
  • 研究担当者:木村延明、吉永育生、関島建志、安瀬地一作
  • 発表論文等: