生物系特定産業技術研究支援センター

SIP

第2期 スマートバイオ産業・農業基盤技術

Creative Researchers - 研究者インタビュー

第7回

「分からないことを全部見る」から始まるサイエンスの魅力
データ駆動型研究で明らかにするマイクロバイオームとヒトの関係

第6回 吉間めぐみ・菅原彩華 公益財団法人流通経済研究所

「食によるヘルスケア産業創出コンソーシアム」では、健常者の食・健康情報、腸内マイクロバイオームを統合したデータベースを構築し、公開することを目標としています。世界に先駆けたDNAロングリードシーケンサー(DNAの塩基配列を解読する装置)の活用による、ヒトの腸内マイクロバイオームのデータベース作成に取り組む理化学研究所生命医科学研究センターの須田亙さんに研究の意義と魅力を聞きました。

次世代シーケンサーの誕生で可能になった研究

――食によるヘルスケア産業創出コンソーシアムの中で、須田先生はマイクロバイオームのデータベース整備に取り組まれているということなのですが、マイクロバイオームとはそもそも何でしょうか。

須田:微生物というのは環境中いたるところにいて、各環境の生態系の物質循環や、ヒトの体内であれば健康維持などに重要な役割を果たしていることがわかってきています。マイクロバイオームというのはこの、「ある環境に存在する菌の集団全体」を指す言葉です。日本語でいうと微生物叢、菌叢とか、フローラといったりもします。

マイクロバイオームという言葉が使われ始めたのは、比較的最近のことなんです。2005年頃から次世代シーケンサーが登場したことで、従来のDNAシーケンサーと比べて圧倒的に大量のDNAシーケンスを早く安く読めるようになりました。これによって、今までアイデアはあっても実現できなかった、環境中にいる微生物の「全体」を見るという手法が使えるようになり、複雑な環境中の微生物叢の全体にアプローチする学問が実際にできるようになりました。そうして、特にヒト常在細菌について「マイクロバイオーム」という、全体をとらえる研究が始まったというわけです。

――ヒトの体内にはどのくらいの数の細菌がいるんでしょうか?

須田:ヒトの細胞はだいたい30兆個あります。それに対して細菌は、最新の研究成果によればだいたい40兆ぐらいと言われています。さらに、この細菌を宿主とするファージというウィルスが、細菌と同数から10倍程度いるのでは言われています。

では、なぜこれらの細菌やファージが重要かというと、遺伝子のバリエーションが圧倒的に多いからです。ヒトの遺伝子は約2万個と言われていますが、腸内細菌の持つ遺伝子は軽く1000万種類を超えます。ヒトが持っていない遺伝子のバリエーションを持っているということは、ヒトの体ができない働きを、腸内細菌が人の中でしているということなんです。例えば、ある種の炭水化物を腸内細菌が消化してヒトに与えていることが分かっていたりします。

――1000万種類というのは、一人の人間の中にそれだけの遺伝子があるのですか。

須田:1000万というのはヒトの集団全体で見た時の数で、ヒト一人を解析して出てくるのは50万から100万種類です。すると何が起こるかというと、2人のヒトがそれぞれ100万種類の腸内細菌を持っていたとしても、同じ部分と違う部分があります。つまり、ヒトの菌叢には個性があり、個人ごとに異なる遺伝子を持っている。近年、マイクロバイオームはヒトの栄養吸収や病気についても密接に関連することがわかってきていて、この分野の論文数はどんどん増えています。

――腸内細菌にも個性があるということですが、指紋のように一生変わらないものなんでしょうか?

須田:生まれてくるときは無菌に近い状態で生まれてきて、離乳のタイミングで一気に菌が増えて大人と同じ水準になるのですが、菌叢の中で菌種の入れ替わりは起きています。ただ、どの時間をとって比較しても、まったくの他人より自分自身の過去の菌叢と似るんですね。つまり、個人ごとの特徴があって、通常はそれが保たれています。遺伝因子が全く同じ一卵性双生児でも菌叢ははっきり違うので、見た目で区別がつかなくてもウンチ、つまり腸内マイクロバイオームを見ればわかります。

そのくらい菌叢というのはユニークなものなのですが、それを超える疾患による変化というものがあります。なので、健常者の集団と疾患者の集団の菌叢を比較すると、疾患にもよりますが、統計的に健常と疾患を見分けることが可能です。例えば、原発性硬化性胆管炎という、潰瘍性大腸炎と見分けるのが臨床的に難しい病気があるのですが、唾液の菌叢の違いによる層別化を取り入れるだけで正解率が9割近くまで上げられます。逆に、腸内細菌を正常化すれば病気が治るという例もあって、例えばクロストリジウム-ディフィシル感染症という、抗生剤が30%しか効かないような感染症でも、健常者の糞便を腸内に移植すると94%が治るという研究があります。

マイクロバイオームの変化を捉えるためのカタログ作成

――腸内細菌の変化でヒトの健康状態が分かったり、逆に腸内細菌を変えることで健康にすることができたりするのですね。「食によるヘルスケア」というテーマの中で、マイクロバイオームはどのような役割を果たすのでしょうか。

須田:コンソーシアムの研究は、個人をモニタリングして食と生活習慣で健康管理するための関係性を見つけていくものです。その中で、健康管理のための測定項目の一つとして、腸内マイクロバイオームを取り入れるために、我々が参画しています。

――機能性食品などを摂取することで、腸内マイクロバイオームがどのように変化するかを明らかにしていくということでしょうか。

須田:私達のチームの役割は、「マイクロバイオームの変化」を捉えるための技術開発です。DNAを根こそぎ、偏りなく採取して、そのままゲノム配列を次世代シーケンサーで読み取る「メタゲノム解析」を、ロングリードシーケンサーという、従来よりも長い(塩基数が大きい)配列を読み取れる次世代シーケンサーを使って行います。200人の日本人のマイクロバイオームをロングリードシーケンサーで読み取ったメタゲノムを使って、健常者の日本人の腸内細菌のデータベースを構築します。

理化学研究所に設置されたロングリードシーケンサー。1リードで1万塩基程度の配列を連続して読み取れる。

――ロングリードシーケンサーというのは従来の次世代シーケンサーよりも長い配列が読み取れるということですか? 長い配列が読み取れると何が分かるのでしょうか?

須田:マイクロバイオームの中にあるDNAの全てが、細菌のゲノムに由来するものではなくて、細菌に感染する「ファージ」や、細胞核の外側にある「プラスミド」のDNAが含まれます。プラスミドやファージは、個体内で、あるいは個体を超えて別の個体に遺伝子を運ぶ「可動性因子」と言われます。プラスミドやファージは、ゲノムに比べるとずっと短いです。

メタゲノム解析で一番使われている次世代シーケンサーは、「ショートリードシーケンサー」と言って、1回で読み取る塩基配列が長くて300塩基、普通は百数十塩基程度の長さのものです。細菌のゲノム全体の長さである数百万塩基と比べてあまりにも短いため、つなぎ合わせて元の配列を復元することは困難です。また、読み取ったリードがゲノムの一部なのか、ファージやプラスミドのように、移動するものなのか区別がつきません。

なので、次世代シーケンサーを使ったメタゲノム解析の論文の多くは、どんな菌種が変動しているか、どんな種類の遺伝子に疾病者と健常者の間で差があるかということまでは分析しているのですが、着目している遺伝子がどのように伝搬しているかは分かっていません。

ところが、ロングリードシーケンサーだと1万塩基ぐらいを一気に読めるようになります。長い配列を一度に読み取れることで、元の配列を完全に再現できる確率が上がります。実際に、完全長で読み取れるものを見ると、未知のゲノムがたくさんあることが分かりました。今までは断片化していたので見えなかったゲノムの構造が、分かるようになってきたということです。

蓄積されたシーケンスデータから新たな知見を得るツール

須田:もう一つ重要なのは、プラスミドやファージなどの可動性因子は、ゲノムと比べて短いため、ロングリードシーケンサーで完全長を読み取れるものが多いんです。完全な配列が分かれば、ゲノム、ファージ、プラスミドのそれぞれの配列を層別化することができる。これをショートリードシーケンサーで読み取った配列と照合して、プラスミドやファージを検出し、定量的な変動を測定できます。

実際に、12人の日本人のマイクロバイオームをロングリードシーケンサーで読み取ったメタゲノムデータを分析した結果、新規なプラスミドやファージを発見しました。おどろいたことに、これらの新規なプラスミドやファージは、世界各国の集団の腸内マイクロバイオームに共通して豊富に存在することも初めてわかりました。つまり、ショートリードシーケンサーでは配列が検出されても、それがプラスミドのものだとは判別できなかったため、着目されていなかったのですが、実際には世界中のヒトの腸内にあることが明らかになったのです。腸内細菌は、ヒトの進化と共に何千年も歩んできていますから、世界中のヒトの腸内にいるということは何か役割を持っているはず、と考えられますよね。では、生体内でどんな役割があるのか、というのはこれから解明していくのですが。

――つまり、ロングリードシーケンサーで読み取ったデータを元に、ゲノム、プラスミド、ファージの階層化されたデータベースを作る。それを使うことで、ショートリードシーケンサーで読み取ったメタゲノムからも検出できるようになるということですか。

須田:そうです。メタゲノム解析は、そこにある全てのゲノム情報を読み取る強力な方法というイメージがありますが、実際はデータベースに依存していて、データベースにあるものしか評価できていない現状があります。ショートリードのメタゲノムのデータは世界中で蓄積されていますから、ここに我々が作ったデータベースをあてることで、新しい知見が得られることになるんですね。

――ロングリードとショートリードでは、コストはかなり違うんでしょうか?

須田:差は縮まりつつありますが、それでも現状ではコストが10倍以上違います。でも、ロングリードで作ったデータベースを一度構築すれば、ショートリードで読み取ったメタゲノムからも腸内細菌の変動が検出できる。世界に先駆け、ロングリードメタゲノムで、腸内マイクロバイオーム中の染色体/プラスミド/ファージを層別化した高精度なデータベースを整備することで、さまざまな企業がショートリードシーケンサーで蓄積したメタゲノム情報から、食品や疾患による詳細なマイクロバイオームの変動、つまりマイクロバイオームがどのくらい健康状態に寄与しているのかということが引き出せるのではないかと考え、取り組んでいます。

――マイクロバイオームの中でもプラスミドやファージの変動を捉えることがなぜ重要なのでしょうか?

須田:ゲノムの進化というのは、長い歴史の中でDNAに変異が起こり、それが環境によって淘汰されることで、非常にゆっくりと進みます。これに対して、ファージやプラスミドを取り込むことは、横からDNAが入って、それまでなかった能力を突然獲得できてしまうという、非常に便利なものです。例えば抗生剤にやられそうな細菌が取り込んだプラスミドが、たまたま抗生剤への耐性を持っていれば細菌が生き延びて繁茂できる。進化学的に見れば、環境の変化に素早く対応できる武器になるんです。

したがって、食品や薬の効果を評価するには、プラスミドやファージの変化を見ることも重要と思っています。「食べ続けて数世代後に腸内細菌のゲノムが変わるかもしれない」では遅い。食品や薬に、特定のプラスミドやファージを増やす効果があって、その結果身体によい効果を及ぼしていたとしても、いままではそれを知る方法がなかったため評価もできませんでした。なので、こうして方法を整備する必要があると思っています。

日本人の健康を「データ駆動型」で研究可能にする

――日本人200人、ということですが、国によってもマイクロバイオームは異なりますか?

須田:顕著にちがいがあります。ショートリードシーケンサーを使った研究ですが、アメリカ、ヨーロッパ、中国などから報告された、大規模な腸内マイクロバイオームの遺伝子データセットで990万個の遺伝子が報告されています。これと、私達が100人の日本人のメタゲノム解析から見つかった500万個の遺伝子を比べると、重複したのは200万個だけでした。つまり300万個は日本人に特徴的な遺伝子だと分かったんです。

また、世界各国の腸内マイクロバイオームの菌種組成をクラスタリングしてみると、国ごとに特徴的な菌組成を持っていることが分かりました。国による差というのは、健常者と疾病者の差よりも大きくて、例えば日本人で潰瘍性大腸炎の患者の菌叢は、フランス人で同じ疾病のある人よりも日本人の健常者の菌叢に近いこともわかって来ています。だから、日本人の健康や疾病と腸内細菌の関係を研究するのであれば、日本人のデータベースは必須です。今回のSIPで整備するのは、200名の、しかも健常者から集めたデータということで、さまざまな研究のリファレンスとなる貴重なデータになります。

――SIPバイオ農業において、食による健康に取り組む企業や研究者が、持っているデータをより活用できるようにするための道具を作っている、という位置づけなのですね。

須田:その通りです。データベースができることで、今までは菌種という遺伝子でしか見えていなかったものが層別化され、解析の精度が変わって、見える世界が変わってくると思います。動きが分からないものがあったら、まずそれが分かるような技術を開発して全体像を正確にとらえる。その後、何が起こっているかをデータから考える、というやり方が可能になります。

仮説検証型の研究、例えば「この食品はAという成分を含んでいるから、きっとXという菌を増やして身体によい物質を出すはずだ」という仮説を立てて検証するのではなく、実際に食品が体内に取り込まれることで、マイクロバイオーム全体にどのような変化が生じているのかを詳細に明らかにして、食品がマイクロバイオームを通じて身体にあたえる影響とメカニズムを考えるような研究手法、「データ駆動型研究」と我々は呼んでいますが、この方法によって新しい発見ができるようになるための基盤を提供することが大事だと考えています。

多様性とダークマターであることが魅力

――食と健康の研究に、マイクロバイオームのデータベースを整備するのは大きな意義のあることなんですね。このテーマには学生時代から取り組まれていたのですか?

須田:実は私、大学は水産学部でして、研究よりもむしろ音楽に熱中していました。大学を卒業してもしばらくはミュージシャンを目指していたのですが、やはり手に職をつけようと思って専門学校で実験技術を学びました。実験は得意だったので、卒業したらどこかの検査場で技師として働こうと思っていました。

ところが、専門学校で出会った先生に、「地球は微生物の惑星といわれているけど、ヒトが知っているのはその0.1%以下と言われているんだよ」と言われて衝撃を受けたんです。その頃はヒトゲノム計画も終わっており、バイオテクノロジーは行くところまで行きついていると思っていたのに、自然界にはまだまだ知られていない微生物の方が多いということに興味を持ち、千葉大学の園芸学部の大学院に進学しました。

その後、東京大学の服部正平先生が国内でいち早く次世代シーケンサーを導入したメタゲノム研究に取り組んでおられるのを知り、学位取得後に服部先生のところに行きました。それからはヒトマイクロバイオームを中心に研究していますが、興味の範囲はヒトだけにとどまっているわけではなくて、海洋や河川の微生物研究の方とのコラボレーションもしています。

私の研究のモチベーションは、微生物の多様性と、知られていないことが多いということに面白さを感じて、「分かっていないことがあるなら知りたい」というところからスタートしています。

一般的な科学の進め方は、問題に対して仮説と対立仮説を立て、そして対立仮説を棄却することで前に進む、というものだと思います。でも私がやりたかったのは、分かっていないことをとにかく全部見た上で、見た内容を検証する過程でサイエンスを見つけていくということでした。

学部時代には自分の理想と現状のギャップで苦しんでいた時期があるのですが、服部先生の下に入ってからは自分の思い通りの方法で満足いく研究ができていました。環境中にたくさんいる微生物の生存戦略や生き様に興味があって、それがヒトや環境にどんなインパクトを与えているのかが知りたくて研究を続けています。

――先生にとって、微生物研究の魅力とは何でしょうか?

須田:微生物の多様性と、「そこにあるけれども分からない」というダークマター(存在するが見えない物質)であることに取りつかれたんだと思います。今、研究者の道に入るきっかけになった専門学校で微生物学の講義を持たせていただいていますが、学生には「分かっていることよりも、分かっていないこと、知りたいことを大事にしてほしい」と言っています。

――須田先生ご自身が専門学校で学んだ、いわゆるウェットな実験技術は、今取り組まれているデータ解析の研究で役立っていますか?

須田:はい、ものすごく役立っています。私自身、今は実験を離れてデータ解析をやっていますが、実験技術の精度には自信がありまして、ある学会で企業が主催しているピペットの操作を競うイベントで優勝したこともあります。

解析する試料からDNAを取り出すのが下手だとシーケンス分析の結果得られるマイクロバイオームの構造が偏ってしまいます。私達は酵素で菌の細胞の殻を溶かして中身のDNAだけ取るのですが、やり方が悪いと殻の厚い菌の細胞を溶かせないので解析結果が偏ってしまうし、夾雑物が入ることでシーケンスのクオリティも影響をうけます。これはデータ解析者にとっては致命的です。データ解析から見つけた菌を狙って分離培養する工程などにも、非常に修練されたテクニックが必要です。だから各実験のステップの原理と手順を理解して動ける人材がものすごく重要で、今、私のラボで実験をしている方たちはその点信頼できる方ばかりです。

酸素に触れないチェンバー内で腸内細菌を分離培養する操作。正確な実験が結果を分ける。

私自身が実験の修行をしたことで微生物学や分子生物学の実験の原理が基本的に分かるため、各工程でバイアスが生じるポイントも分かります。そこをきちんと押さえていくことで、信頼できるデータを取れる。だから安心してデータ解析に取り組めます。

数理モデルでマイクロバイオームの挙動を予測・制御可能にしたい

――マイクロバイオーム研究、まだまだやることはたくさんありそうですが、こんな若い人と一緒に研究したい、というのはありますか?

須田:様々な分野において、実際の複雑な現象からのデータ解析やモデル作成に取り組んでいる人にひかれます。今は、データベースを作って、マイクロバイオーム全体を徹底的に記述して、その時系列変動を把握することを目指しています。すると次に知りたくなるのが、その予測と制御なんですね。

マイクロバイオームの中には複雑な菌の相互作用があって、ホストのプレッシャーも受けて、食べ物や化学物質にも暴露されている。微生物だけではなく、環境もインプットとして普遍的な法則、要は数式を作ってくれる人がいればいいなと思っています。そういう数理モデルができれば、このファクターを動かせばマイクロバイオームがこう変わるかも、という予測ができる。

それを実験で確かめるというのが本当のデータ駆動型研究だと思っているので、微生物にとらわれず多彩なデータを解析できる人とコラボレーションできればと思っています。マイクロバイオームのデータを解析する人員もまったく足りていないので必要だと思っていますが、私にはできない新しい見方をしてくれる人はとても重要だと感じています。

――最終的に、菌とヒトの関係性を完全に解明することはできるのでしょうか。

須田:それを目指してはいるのですが、考えないといけないことはたくさんあります。例えばSIPのロングリードシーケンサーで読んだメタゲノムでは、ファージの中でも1本鎖のファージや、RNAウィルスは検出できていないとか、あとは真核微生物も腸内にいるけど層別化する情報学的技術は現在模索中であるとか、まだまだ見えていないものがあります。

ただ、そうしたものは技術が発達することで、いずれは全部見えるようになると思っています。だから、その先に何をするか、常に考えなくてはいけないと思っています。例を挙げると、複数の菌が同時に存在することで、宿主の免疫を刺激する効果のある菌の組み合わせが見つかっているのですが、相互作用のメカニズムはまだ完全には解明できていません。今は実験的にいろいろな組み合わせを発見している段階ですが、数理モデルや、あるいはAIのようなものが予測に役立つかもしれない。まだまだやることはたくさんあると思っています。

須田 亙(すだ・わたる)
国立研究開発法人理化学研究所生命医科学研究センター
マイクロバイオーム研究チーム 副チームリーダー

2010年に千葉大学大学院で学位(博士・農学)を取得して以降、メタゲノム解析を主軸としたヒトマイクロバイオームや環境中マイクロバイオームの研究に従事。東京大学大学院での研究員、慶應義塾大学医学部での助教、講師を経て、現在は理化学研究所生命医科学研究センターにて、研究を展開中。