#19 解析技術の専⾨性と汎⽤性

2022.03.10

株式会社アンプラットが開発・運営するデータ解析プラットフォーム「ANCAT」ではバイオインフォマティクスを始めとした、様々な分野のデータ解析⼿法を提供しています。ANCATでは"遺伝⼦変異解析"のような超専⾨的な解析⼿法から、"統計解析"のように汎⽤的に使える解析⼿法まで公開されています。この専⾨性と汎⽤性を決定づけるもの⼀体何なのでしょうか。本記事では解析技術の専⾨性と汎⽤性、また、その関係性について記載していきます。


統計解析とは

導⼊⽂にて、汎⽤的な技術と形容した統計解析ですが、そもそも統計解析とは何なのでしょうか。ここでは、数学的な説明を省きますが、例えば、新薬が完成したとして、それが本当に効く薬だと判断するにはどうしたらいいでしょうか?

おそらく⼤半の⼈は「⾊んな⼈で試してみる」という事をイメージされるかと思います。そしてそれは正解です。ただ、何⼈の⼈で効果があれば効いたと⾔えるのでしょう?⼈種が変わったら効き⽅も異なるかもしれませんし、性差もあるかもしれません。このように、絶対的な答えが無い結果を説明するための便利な学問が統計学です。(こんなことを⾔うと本職の⽅に怒られるかもしれませんが・・・!)

専⾨性の⾼い解析とは

専⾨性が⾼い解析というのは、その学問領域に特化した解析⼿法を指します。例えばバイオインフォマティクスにおける遺伝⼦変異解析を例に挙げると、専⾨外の⽅は、どんな解析なのかわからないことがほとんどです。ただ、実際は、次世代シーケンサーから取得したDNA配列の断⽚を既知のゲノム配列に貼り付け、どこが違うのか⾒⽐べているだけです。


重要なのは、何千万というDNA配列断⽚が、⼀本のゲノムのどこに該当するのか、それは果たして変異として捉えてよいのか、アルゴリズム上のエラーではないのか等の判断です。こうした判断の⾃動化に際し、確からしさを数値化する統計⼿法が組み込まれてきました。統計解析は遺伝⼦変異解析以外にも、RNAの発現⽐較解析、バイオマーカーの探索や各Omics科学的⼿法等、様々な解析⼿法に組み込まれています。

統計学がつなぐ学問

第⼆章でお伝えしたとおり、統計解析というのは、ありとあらゆる学問の解析⼿法に組み込まれています。それ故に他分野の学問を覗くには良い⼊り⼝になりえます。株式会社アンプラット様は学問横断的に解析⼿法を開発実装していますが、既知の技術基盤を強固なものとし、それに付け加える形で専⾨性の⾼い知識やスキルを仕⼊れることでこれを実現しています。

私個⼈の考えとしては、これは株式会社アンプラット様のような特殊な企業以外でも役に⽴つことであり、知⼒の最⾼峰である学者同⼠が、たとえ異分野であれど⼿を取り合うことでワンランク上の研究ができるのではないかと思っています。

ライフインフォマティクス

ひとえに異分野間の連携と⾔ってもイメージが沸かないと思うので、株式会社アンプラット様の取り組みについて紹介します。株式会社アンプラット様はバイオインフォマティクスが⼀番得意なのですが、これを極めたところで、直接的に⼈類の発展につながることはないでしょう。

実際バイオインフォマティクスは医療現場や製薬企業で取り⼊れられることで、⼈類の発展に寄与してきました。株式会社アンプラット様ではバイオインフォマティクスの次の⼀⼿として、「⽣体」と「⽣体を取り巻く環境」に注⽬し研究開発をライフインフォマティクスと定義し事業を展開しています。

例えば、気圧が低い⽇に⽿鳴りや頭痛がすることがあると思いますが、この現象を明らかにするには⽣体情報だけでなく気象情報が必要です。こうしたライフインフォマティクスの取り組みの⼀環として、先⽇ANCATにはMeteorologyの解析カテゴリを実装しました。


主にアカデミアで⾏われる純粋な基礎研究も素晴らしく尊いものですが、ライフインフォマティクスのように、⼈類の発展に振り切った研究も尊いものだと私は思います。

まとめ

最近は統計とは別の考え⽅として、機械学習も盛り上がってきています。両者の決定的な違いは数字のマジックか、経験則のマジックかの違いですが、⼤きなデータから何かを⾒出そうとするための⼿法であることに違いはありません。

こうした汎⽤的な解析⼿法が専⾨性の⾼い解析に取り⼊れられ、その汎⽤性を⼊⼝として学問をつなぐという⾒⽅をすると、ありふれた解析⼿法が特別なものに⾒えるかもしれません。
上述の通り、株式会社アンプラット様ではバイオインフォマティクスに限らず、多種多様な学問領域の研究者を⽀援しておりますので、株式会社アンプラット様の取り組みにご興味のある⽅はぜひホームページからお気軽にご連絡ください。

関連記事

#7 これからデータサイエンスをチームに導入する方へ

#10 オープンサイエンスとデータ共有

#13 解析⼿法を共有・利⽤する⽅法