#22ゲノム医療と情報技術

2022.04.28 By Hayashi

この連載テーマについて

株式会社テンクーは、最先端の情報技術を用いて、ゲノム医療のためのトータルソリューションソフトウェア Chrovis (クロビス) とそのサービスを提供する大学発ベンチャー企業です。
第一回では、テンクーの設立とChrovis開発の経緯、臨床現場での活用について、その概要をご紹介いたしました。第二回では、がん遺伝子パネル検査を例として、ゲノム医療において、情報技術が果たす役割をご紹介いたします。

ゲノム研究からゲノム医療へ

私たち人間は約37兆個の細胞からできていると言われています。各細胞には、染色体という構造の中に「DNA(デオキシリボ核酸)」という生命の設計図となる物質が折りたたまれて入っています。私たち全ての細胞は、父親由来、母親由来で23本ずつ、合計46本の染色体があります。この染色体の中にDNAが入っています。

DNAの並び、塩基配列の中で、タンパク質を決定する部分を「遺伝子」と呼びます。細胞の中で、遺伝子の情報は、DNAからRNA、タンパク質に変換されて、機能や役割を果たしています。様々な遺伝子の情報を組み合わせて働くことにより、一つ一つの細胞が異なる機能を担うことができます。

人間には2万以上の遺伝子があると言われており、EGFR遺伝子、KRAS遺伝子など、遺伝子ごとに名前がついています。これらのDNA、遺伝子の情報の全体を「ゲノム」と呼びます。

遺伝子とは何か


1990年に米国政府らのファンディング等により、「ヒトゲノム計画」が始まりました。これは、ヒトのゲノムの全塩基配列を解析するプロジェクトで、2003年に完了しています。2003年というのは、1953年のワトソンとクリックのDNA二重らせん構造の発見からちょうど50年目という節目でした。その後もこの「ヒトゲノム計画」の成果を基礎として、ゲノム関連の研究は進んでいきました。

2010年過ぎから、ゲノムの読み取り装置(次世代シークエンサ)の価格が下がり、ひとりひとりの方のゲノムを読むことが現実的に可能な価格と時間になってきたことで、ゲノム情報を疾患の診断や治療、予後予測や予防など、実際の臨床現場に生かすゲノム医療が進み始めました。ゲノム研究からゲノム医療へ移行するとともに、膨大なゲノムデータが指数関数的に蓄積していくこととなりました。ゲノムデータを適切に臨床現場で活用していくために、いかにしてゲノム情報を処理し、意味付けしていくのか、ここに情報技術の活躍できる世界が広がっています。

 

がん遺伝子パネル検査と情報技術

ゲノム医療が特に進んでいる疾患領域としては、「がん」です。
がんと診断された患者さんは、医師と相談の上、がんゲノム医療の対象となる場合に、「がん遺伝子パネル検査」を受けることになります。がん遺伝子パネル検査は、次世代シークエンサ(NGS)を用いて、遺伝子の情報を読むシークエンスをするWet(ウェット)の部分と、そのシークエンスした結果のゲノム情報を解析して意義付けを行うDry(ドライ)の部分に分けられます。

がん遺伝子パネル検査の流れ

実験側とデータ解析側、それぞれの部分について、実際に人が細胞などを取り扱って生物学的な実験をする部分をWet、コンピュータを利用して解析する部分をDryと呼んでいます。


Wet(ウェット)部分とDry(ウェット)部分

 

Wet部分で、細胞からDNAやRNAを抽出し、ライブラリ調整という前処理をして、ゲノムの読み取り装置である次世代シークエンサにかけ、塩基配列を読み取ります。シークエンサから一人あたり数GBから数百GBのゲノム情報が出てきます。塩基配列は、A(アデニン)、T(チミン)、G(グアニン)、C(シトシン)という核酸からなり、このATGCの文字の情報として出力されます。

シークエンサからの出力としては、ATGCの文字列が100文字や200文字並んだ行が数億行ある、というイメージです。この文字情報を整理して、リファレンス配列(参照配列)と呼ばれるヒトゲノムの並びとマッチングさせ(マッピング)、遺伝子の情報が書きかわっている部分を見つけて行く作業(バリアントコール)を行います。

臨床の現場に繋ぐためには、書きかわった部分を見つけたあと、その部分が、がんに関係しているのか、病気に関連しているのか、その部分を対象にした薬があるのか、などを探してきます。その際に膨大な医学や生物学の知識を集めた知識データベースを用いて、意義付けを行い、その結果をまとめてレポートを作成します。

Dry部分の3分野

 

このDry部分をまとめると、「データ解析部分」「意義付けの元となる知識データベース部分」「意義付けの結果をまとめたレポート作成部分」の3つが主な作業部分となります。これらはコンピュータが適切なソフトウェアで自動で行った方が品質は高くなり、また時間も短縮することができます。

特に、意味付けの部分は、膨大な情報の参照やルールの仕組みが必要なため、データ量、コンピュータパワーに加えて、意味付けの仕組み、ソフトウェア自体が鍵となります。さらに、この意味付けは、臨床応用を踏まえるとレポートの内容に直結する部分です。

このレポートに基づいて、医師が治療方針を検討することを考えると、遺伝子パネル検査に占めるDryの役割、情報技術の貢献は大きいと言えます。ゲノム情報を元に、合う薬剤や臨床試験を、いかに効率的に、もらさず見つけられるか、医師に参考情報としてお薦めできるかが、最終的には価値につながっていきます。

テンクーが開発するChrovisでは、抜け漏れのない情報検索を可能にする独自の特許技術、パラフレーズ検索など最新の情報技術を採用し、複数のデータベースを横断的に検索し、適切な情報を抽出することを可能にしています。また、実際の臨床現場で求められる安定したオペレーションを実現するため、解析からレポート作成まで自動化に対応し、持続的なシステムを構築しています。

 

まとめ

ここ数年で、耳にする機会の増えたゲノム医療ですが、その裏には、情報技術の活躍があり、そのオペレーションにはコンピュータシステムが大いに貢献しています。
次回は、テンクーが開発するChrovisが実装している技術についてご紹介いたします、お楽しみに。

 

関連記事

#14 がんゲノム医療の臨床現場を情報技術・AIでサポートする

#7 これからデータサイエンスをチームに導入する方へ

#10 オープンサイエンスとデータ共有

#13 解析⼿法を共有・利⽤する⽅法

#19 解析技術の専⾨性と汎⽤性

本連載にて紹介するベンチャー企業情報は経済産業省が運営する大学発ベンチャーデータベースに掲載されております。 これまでにない技術やサービスに触れ、知識拡大やオープンイノベーションのきっかけにしてください!