開発の社会的背景と研究の経緯
ウイロイドはわずか250~400塩基5) のRNA分子のみからなる最小の植物病原体です。ウイロイドは汚染した農器具等を介した汁液伝染などにより、様々な植物に伝染します。近年、野菜や果樹、花き類に病害を引き起こすウイロイド病害が、感染種子等の国際的な移動によって世界各地で発生しています。これらのウイロイドに感染した植物に対し有効な薬剤はなく、一度感染すると、感染植物を全て廃棄処分しなければなりません。ウイロイドに感染した植物は、無症状から株の矮化、さらには致死まで、幅広い症状を示します。その症状は、ウイロイドの変異体と植物の種類(あるいは栽培品種)の組み合わせによって決まることが報告されています。例えば、あるウイロイド変異体に感染した植物は無症状であっても、その変異体に感染した別の植物種は重篤な症状を示すことがあります。ウイロイドに感染しても無症状である宿主植物種も多いことから、そのような感染植物の種苗が気づかれないうちに海外から国内に持ち込まれ、我が国の重要な農作物に対し重大な被害を引き起こすおそれがあります。このような発病リスクの高いウイロイドが国内に侵入することを防ぐため、無症状感染による潜伏リスクを事前に把握することが必要です。
例えば代表的なウイロイドの1つである"ジャガイモやせいもウイロイド(Potato spindle tuber viroid; PSTVd)"は、重要な農作物であるジャガイモやトマトに感染し農業生産に重大な被害を与えるおそれがある病害です。このため、我が国では植物防疫法において検疫有害植物の1つに指定されており、トマトの種子等の輸入に際して輸出国においてPSTVdに対する検査が要求されることがあります。ジャガイモではPSTVdに感染すると塊茎の異常が、またトマトでは矮化や奇形、葉の黄化などが生じます(図1 )。また、農作物に多く見られるナス科やキク科植物の他、幅広い植物種が感染します。また、本ウイロイドは異なる植物種を経て伝染する過程で、ウイロイドの塩基に変異が生じることで病原性が変異することが知られており、現在、2000以上ものPSTVdの変異体が登録されています(DNA Data Bank of Japan)。
図1 PSTVdに感染したジャガイモの塊茎と健全なジャガイモの塊茎(左)および強毒性から弱毒性まで示す各PSTVd変異体に感染したトマトと健全なトマト(右)
PSTVdには複数の変異体が報告されており、弱毒株に感染したトマトではほとんど病徴を示しません。しかし、強毒株に感染したトマトでは強い矮化症状や葉の萎縮などが見られるようになります。
植物に対するウイロイドの病原性は、トマトなどの植物に接種した後、数ヶ月にわたる栽培を行い、接種植物における症状の有無などの結果をもとに病徴の強度により評価する必要があります。このとき、周辺へのウイロイドの漏洩を防ぐために閉鎖環境で接種試験や栽培管理を行う必要があります。そのため、従来の接種試験は時間がかかるだけでなく、閉鎖された栽培施設などの特別な施設が必要となります。とくに評価するウイロイド変異体や植物種の数が多ければ、その組み合わせは膨大な数になり、多大な労力が必要となります。
この問題を解決するために、我々はバイオインフォマティクス6) および機械学習7) の技術を取り入れ、コンピュータ計算のみで、PSTVdによる病徴の強度を予測する方法の開発を目指しました。
研究の内容・意義
ウイロイドによる発病強度を予測するアルゴリズムの開発
我々は、PSTVdによるトマトにおける病徴の強度を予測するために、ウイロイド由来の小さなRNA断片が植物の遺伝子発現制御機構の1つであるRNAサイレンシング8) を介して植物のRNAの発現を抑制するなどして、植物が発病するという仮説に基づいてアルゴリズムを開発しました。また、アルゴリズムによって得られた予測と実際の植物での病徴の強度を比較することで、アルゴリズムの正確性の検証を行いました。
まず、我々は核酸配列データベースから入手した多数のPSTVdの変異体の遺伝情報であるRNAの塩基配列情報を、コンピュータ上でランダムに断片化することでウイロイド由来の小さなRNA断片を擬似的に大量に作りました(図2 上段)。次に、これら人工的に作られたウイロイド由来の小さなRNA断片を、同じく核酸配列データベースで入手した宿主植物トマトの遺伝情報であるDNAに対して照合を行い、ウイロイド由来のRNA断片がトマトのDNAと結合できる場所を調べました(図2 中段)。続けて、このDNA断片の結合部位の位置情報により、PSTVd変異体をグループに分けました(図2 下段)。このグループ分けは、機械学習で多用されるアルゴリズムであるUMAP9) およびDBSCAN10) を組み合わせて行いました。この方法で300以上のPSTVd変異体についてグループ分けし、トマトにおける病徴の強度を予測するためのアルゴリズムを開発しました(図2 )。
実際にトマトへ様々な変異体を接種して得られた病徴の強度と、開発したアルゴリズムを用いて予測した病徴の強度を比較した結果、強毒あるいは弱毒のウイロイド変異体を高い精度で予測可能であり、本アルゴリズムの有効性が示されました(図3 )。
図2 ウイロイド病原性を予測するアルゴリズムの概要図
この予測アルゴリズムでは、環状となっているPSTVd各変異体のゲノムをランダムな位置で切断し、短い断片を大量に作成します。次に、それらの断片がトマトのゲノムのどこに結合できるかを調べて、その位置データを集計します。最後に、この位置データをUMAPとDBSCANを使ってグループ分けします。
図3 アルゴリズムによる病徴の予測と実際の接種試験によって得られた病徴の比較
色丸はPSTVdの変異体を示しています。
今後の予定・期待
本研究で開発したアルゴリズムは、植物病理学の分野での利用が期待されます。本手法を適用すれば、最小限の接種試験で大量のウイロイド変異体の病原性を一度に予測できるようになり、病原性評価に必要な栽培試験に要する時間や場所の大幅な削減が期待されます。また、無症状感染によって潜伏したウイロイドが汚染源となることを未然に防止することで、今後の本アルゴリズムの実証化によりウイロイドの感染による被害の低減に役立つことが期待されます。将来的には、宿主植物のゲノム情報を活用することで、トマト以外の様々な宿主における様々なウイロイドの病原性を予測することもできるようになります。植物防疫や関連研究機関が、接種試験を行わなくてもウイロイドの病原性を知ることができるようになり、ウイロイドに感染した際のリスク評価やその評価を基にしたウイロイドの侵入や潜伏リスクの評価などへの技術貢献が期待されます。
用語の解説
ウイロイド
一本鎖の環状RNAのみからなるウイルスよりも小さな植物病原体です。植物に感染すると植物の細胞内で複製し、全身に移行することができます。野菜類、花き類、果樹類などに感染することができ、一部の植物種では発病することで収量の低下などの被害を引き起こします。主に汁液などの接触などで伝染し、トマトなどの野菜が感染するウイロイド種は種子を介して次世代個体にも伝染します。
[ポイントへ戻る]
変異体
ゲノム配列に変異が生じた個体のことです。例えば、ウイロイドの場合、250~400塩基のうち、何らかの原因で1塩基あるいは数塩基が変化して生じた新しい個体のことを指します。二つのウイロイド個体のゲノム配列の塩基構成が概ね90%以上同じであれば、両者を同一ウイロイド種の変異体として扱います。
[概要へ戻る]
ジャガイモやせいもウイロイド(PSTVd)
世界で初めて同定された代表的なウイロイドです。PSTVdは主にナス科の野菜や花きに感染することが知られています。ジャガイモやトマトが感染すると奇形や矮化などを生じます。ジャガイモやトマト等ナス科植物において、PSTVdは種子伝染することが知られています。各国が侵入警戒しているウイロイドの1つであり、我が国においても国内の農業生産に甚大な被害を与えるおそれがあるため、植物防疫法において検疫有害植物の1つに指定されています。
[概要へ戻る]
ゲノム
生物が持つ遺伝子情報のことです。一般的に動物や植物の遺伝子情報はDNAに記録され、ゲノムはDNAに記録された情報のすべてです。また、ウイロイドや一部のウイルスなどの遺伝子情報はRNAに記録されています。
[概要へ戻る]
塩基
遺伝情報を構成する単位です。アデニン(A)、グアニン(G)、シトシン(C)、チミン(T)、やウラシル(U)などがあります。
[開発の社会的背景・研究の経緯へ戻る]
バイオインフォマティクス
情報科学や統計学などのアルゴリズムを用いて生命現象の解明を試みる学問のことです。
[開発の社会的背景・研究の経緯へ戻る]
機械学習
コンピュータが与えられたデータから規則やパターンを見つけ出し、それに基づいて予測や判断を行う技術です。
[開発の社会的背景・研究の経緯へ戻る]
RNAサイレンシング
RNAサイレンシングとは、植物の細胞内に存在する小さなRNAが相補的な配列をもつRNAと結合して複合体を形成すると、そのRNAが分解される現象です。RNAサイレンシングは、RNAを遺伝子に持つ植物ウイルス等病原体からの防御や植物自身の遺伝子発現の調節の役割を担っています。ウイロイドによる病徴発現はRNAサイレンシングによるものとされています。ウイロイドが植物細胞に侵入すると、RNAの複製が始まり、この過程において植物細胞内において、小さなRNAが発生します。この小さなRNAがサイレンシングを誘導して、ウイロイドの遺伝子RNAが分解されますが、このとき、切断されたウイロイド由来のRNA断片と植物のmRNAの一部が結合して、一時的に二本鎖RNA11) を形成することで、RNAサイレンシングを受けて、本来なら翻訳されるはずの植物のmRNAの一部も破壊されてしまいます。その結果、植物細胞内における植物遺伝子の正常な発現が阻害され、様々な生育不良を引き起こすというものです。
[研究の内容・意義へ戻る]
UMAP
Uniform manifold approximation and projectionの略で、高次元データ12) を低次元データに圧縮したりする方法の一つです。
[研究の内容・意義へ戻る]
DBSCAN
Density-based spatial clustering of application with noise の略で、データをグループ分けする方法の一つです。データに含まれる特徴に対して距離を計算し、似た特徴を持つものを同じグループにまとめます。
[研究の内容・意義へ戻る]
二本鎖RNA
二本のRNAが相補的に結合している状態のRNAを指します。一般的に、RNAは一本鎖(単鎖)の状態で存在することが多いです。しかし、相補的な塩基構成を持つ二本のRNAが近くに存在すれば(例えば、AACCAGUとACUGGUU)、両者が結合して二本鎖RNAを形成することがあります。
[用語の解説 8)へ戻る]
高次元データ
高次元データとは、多くの特徴を持ったデータのことです。例えば、健康診断データが身長、体重、年齢の3つの情報で構成されている場合、これは3次元データと呼ばれます。さらに血圧、血液検査結果、性別など多くの特徴が加わると、次元数が増え、高次元データとなります。次元数が多くなると、計算が複雑になり、機械学習でデータのパターンを見つけるのが難しくなることがあります。これに対処するため、UMAPなどの次元圧縮技術を用いて次元を減らし、低次元データに変換して解析を進めることがよく行われます。
[用語の解説 9)へ戻る]
発表論文
Sun J, Matsushita Y. (2024) Predicting symptom severity in PSTVd-infected tomato plants using the PSTVd genome sequence. Molecular Plant Pathology , 25(7):e13469, DOI: https://doi.org/10.1111/mpp.13469