リモートセンシングデータを用いた重み付き回帰

※アーカイブの成果情報は、発表されてから年数が経っており、情報が古くなっております。
同一分野の研究については、なるべく新しい情報を検索ください。

要約

リモートセンシングデータを用いて水稲の収量を推定する際に、過去のデータと当該年のデータを有効利用するための回帰式を、それぞれのに対する重みと当該年のデータに対する重みを当該年の予測予測誤差が最小になるように最適化することによって最適な回帰式を作製する。この方法は回帰式として重回帰式を用いる場合にも加法モデルを用いる場合にも有効である。

  • キーワード:重み付き回帰、加法モデル、重回帰、リモートセンシング
  • 担当:中央農研・データマイニング研究チーム
  • 連絡先:電話029-838-8948、電子メール datamining@ml.affrc.go.jp
  • 区分:共通基盤・情報研究
  • 分類:研究・参考

背景・ねらい

リモートセンシングデータの利用においては、過去のリモートセンシングデータと地上データに加えて、当該年においても一部分の地点においてはリモートセンシングデータと地上データの両方が得られていることがある。その場合、当該年の地上の様子を推定するための回帰式を推定するために過去のデータも有用であると考えられる。そこで、両者のデータを有効に利用して回帰式を作成する方法を開発した。

成果の内容・特徴

  • 過去のデータと当該年のデータに対して重みを付けて回帰式を作製する。すなわち、数式を最小にすることによって回帰式( 記号)を求める。 数式が過去の2001年と2002年のデータ、 数式が当該年2004年のデータ、 Wが過去の2001年と2002年のデータに対する重みである。ここでは、いくらか性質の異なるデータを有効に利用するための手段として重み付き回帰を用いている。
  • 重み(W)の最適化のために、10群クロスバリデーションによる予測誤差を用いる。
  • 東北地方のある地点の2001年のデータ(25個)と2002年のデータ(31個)と、2004年のデータ(68個)からランダムに34個を選んだものを用いてデータに重みを付けて重回帰式を作製する。予測変数はリモートセンシングデータ(ASTERセンサによって得られた衛星データのうちの4バンド)で、目的変数は10aあたりの水稲の収量である。重み(W)と予測誤差の関係を、10群クロスバリデーションを用いて推定した結果の例が図1である。
  • 3の作業を2004年のデータから34個をランダムに選ぶ際の乱数を代えて20回試行した結果が図2である。図2(上)はそれぞれの試行において選択された重みの値を示している。
  • 図2(下)は、2004年のデータ(68個)のうちの残りの34個を使って、それぞれの試行における最適な重みの値を用いて作製された重回帰式の予測誤差を推定した結果である。2001年と2002年のデータだけを使った場合やよりも、2004年のデータだけを使った場合よりも、重み付き回帰を使った場合の方が、予測誤差が小さくなることが多い。図3と図4は、図1と図2と同じ作業を重回帰式に代えて加法モデルを用いて実行した結果を示している。

成果の活用面・留意点

  • 本方法は、重回帰式あるいは加法モデルを用いた場合に限らず他の回帰手法を用いた場合にも利用できる。
  • 本手法による回帰は、リモートセンシングデータを用いた場合に限定されない。
  • ここで用いた計算と作図のためにはRを使用した。作製したRオブジェクトはいつでも配布できる。

具体的データ

図1 2001年と2002年の全データと2004年のデータを34個使った重回帰式の作製において用いる重みの値の最適化。図3 2001年と2002年の全データと2004年のデータを34個使ったときの加法モデルにおける最適な重みの値の最適化。

図2 重回帰式を用いたとき。2001年と2002年の全データと2004年のデータを34個使って、残りの34個のデータを予測。最適な重み(w)((上))。2004年の残りのデータ34個における予測誤差((下)。黒が重み付き回帰の結果。白が2001年と2002年のデータだけを使った結果。灰色が2004年の34個のデータだけを使った結果。図4 加法モデルを用いたとき。グラフの内容は図2と同じ。

その他

  • 研究課題名:衛星と地上観測設備を組み合わせた水稲の被害率算定システムの実用化モデルの構築の研究
  • 課題ID:222-c
  • 予算区分:JAXAオープンラボ
  • 研究期間:2005~2007年度
  • 研究担当者:竹澤邦夫、二宮正士