LINE公式アカウントから最新記事の情報を受け取ろう!
データサイエンスは測定機器あるいは公開データ等、すでにデータになっているものを解析というIT技術を用いて、人間が解釈できる形に直す作業です。データサイエンスは研究対象によって小分類が存在し、例えば、生命科学研究者にとってのデータサイエンスはバイオインフォマティクス(遺伝子、タンパク等)やケモインフォマティクス(化合物の構造、創薬等)のほうが聞き馴染みがあるのではないでしょうか。現状、次世代シーケンサー等、ハイスループットな実験機器が普及し、いまや小規模な研究室であってもITへの対応は必須の時代になりました。ここでは仕事柄様々なバイオインフォマティクス、データサイエンスのラボを見てきており、解析技術の共有化プラットフォーム「ANCAT」も運営している著者が、これからデータサイエンスを導入していく研究室を対象に、意識したほうが良い「研究活動の冗長性と最適化」についてお話します。
CONTENTS
よくある研究トラブルについて、その対処法と予防策を考えてみましょう。
機器が故障した
第一選択は機器のサポートに連絡を取り直してもらうことです。ただ、修復不能だったり、買ったほうが安かったりすることもありますね。また、あまり日本では一般的ではないですがコアファシリティの利用も一つの手です。予防策としては、外注先や上述のコアファシリティを調べておく等があります。
頼りにしてた人がやめてしまった
企業でもアカデミアでも起こる、いわゆる属人化問題です。外注あるいは採用を急ぐ他ないですが、日本は人を雇うコストとリスクが高い国なので、少しハードルは高いかもしれません。予防策としてはノウハウやスキルの共有が普段からなされるような仕組みと文化の普及が必要です。
HDDが故障して取得したデータが消えた
消えてしまったものはどうにもならないので、ダメ元でデータのサルベージを試みるか、データを取り直すかしかありません。予防策としては普段からバックアップをとっておくのが良いですが、バックアップも労力および機器のコストが掛かります。クラウドコンピューティングを導入できるラボであれば、多少の金銭コストと引き換えに極めて安全なデータ管理が可能です。
冗長化には、少なからずコストが掛かります。中でも、日本の場合、年々減少している予算や、雇用のハードルの高さ、人的コストの問題はシビアです。ただでさえ研究者が研究に没頭できないほどに、リソースが圧迫している状態で冗長化にリソースを割くのは困難です。このような場合、その場しのぎ的に「選択と集中」によるコストカットがなされることが多く、ゲノミクス領域の例だと、「全ゲノム解析したかったがコストカットのためターゲットシーケンスを行った」といったものが挙げられます。この場合、研究が進み、ターゲット外のところを調べたくなった時に後戻りする術はありません。詳しくは後述しますが、研究においては「選択と集中」ではなく、費用対効果の最大化を重視したほうが得策です。
産業界では、現在はVUCAの時代といわれています。VUCAとはVolatility、Uncertainty、Complexity、Ambiguityの頭文字をとった言葉で、それぞれ不安定、不確定、複雑性、曖昧性を意味しますが、これは研究に完全に当てはまります。「VUCA」と「選択と集中」の相性が悪いことは、長期戦略の視点が持ちにくいことからも明らかなので、研究の最適化を考える時に選択と集中は適していません。そのため、費用対効果の最大化で最適化を図っていく必要がありますが、日本は残念ながら選択と集中に舵を切ってきてしまったため、海外に倣う形で最適化事例をご紹介します。
日本にはあまり浸透していない、海外における研究活動の最適化事例として以下のようなものがあります。
研究設備のコアファシリティ化
日本では各研究室ごとに機器を所持していたりしますが、海外では共用施設が充実しており、一般に普及しているため、例えば次世代シーケンサーのような高額測定機器も比較的ハードルが低く利用できます。
情報系テクニカルスタッフの充実
日本ではデータ解析作業を各研究者が行っている一方、海外ではデータ解析を專門とするテクニカルスタッフが雇われている事が多く、研究者は生命科学的な研究に没頭できる環境が整っています。
ラボマネージャーの存在
日本の研究室では、PI自らがラボの戦略を立て、ラボの運営を主導しますが。海外では人員や試薬の在庫管理からラボの戦略まで様々な業務を担うラボマネージャーという人材が雇用されていることが多いです。
教育と研究の分離
日本では、研究者が学生の教育を担当します。PI自らが学生の授業を受け持ち、カリキュラムを考え、資料を準備します。日本で生まれ育つと当たりまえのことですが、これはかなり珍しい制度です。海外では教育と研究は分離されているため、研究者は研究に没頭することが出来ます。
一見、日本が遅れてる部分が多いですが、例えば、未来を担う学生に最高級の教育を与えるというのは見方によっては長所ではあります。著者が運営する「ANCAT」が解決する部分も多いので、またの機会に詳しくお話できればと思います。
研究活動は冗長化と最適化が必須な時代になってきました。日本では残念ながら科学に対する投資が減少傾向になり、すでに米国や中国とはかなりの差がついてきてしまいました。しかしながら、日本には、学生へのハイクオリティな教育に加え、英国に倣いながら進めてきたオープンサイエンスのリードがあります。次回はオープンサイエンスに着目し、データの共有化からその次の一手まで、お話していきます。