LINE公式アカウントから最新記事の情報を受け取ろう!
こんにちは。昨年新入社員としてLab BRAINS編集部の紹介記事を書いた犬派です。今回またご縁がありましてLab BRAINSで記事を書くことになりました。
今回のテーマは研究お役立ちツール&データベース紹介ということで、実は生命科学系の研究室出身の私が当時利用していたツールやこれは便利だ!と感じたデータベースをご紹介いたします。
CONTENTS
生命科学は積み重ねの学問です。先人が残した膨大な量の文献やデータから体系的に「その分野がどのように研究されてきたのか」を理解するところから始まります。次に「その分野でこれまでに明らかになっていない領域はどこか」を調べる。そこまで来てようやく自分が手を動かして結果を出す番がやってきます。まさしく「巨人の肩の上に立つ」ですね。そして結果が出たら自分なりに考察し、研究室のメンバーとディスカッションする。これを何サイクルも回すことで研究は進んでいきます。もちろん調べてから実験して...考察して...ディスカッションして...としているといくらあっても時間が足りないのでこれらの作業を同時並行させることが多いです。
特にB3、B4、M1で新たに研究を始める・新しいテーマに取り組む人はどこで文献を探せばよいか、どれから手を付けたらよいか、何を使えばよいか、優先順位は…と迷いがちです。生命科学の研究はいかに情報を整理し、自身の研究にどう活用するかがポイントです。自分の欲しい情報やツールをかき集めてしまえば、うまくいかない時に「次どうしたらよいか」、「今何ができるのか」が冷静に判断でき強力な武器になります。多くの場合、そういった情報やツールはある程度研究が進んだ段階で見つかって「これをもっと早く知っていれば…!」となりがちです。この記事を読んで便利だと思うツールやデータベースがあれば研究室の皆さんにも共有してみてください!
※今回はGoogle scholarなど他サイトでも紹介されていそうなものは除外しました。
名称 | 概要 | カテゴリ | リンク |
AlphaFold2 | タンパク質の構造解析 | 解析 | URL |
Primer BLAST | プライマー設計 | 設計 | URL |
Lifescience dictionary | 専門用語の辞書(和・英) | 翻訳 | URL |
DeepL | 翻訳 | 翻訳 | URL |
Shaper | deepL用 英文コピペ | 翻訳 | URL |
EndNote | 論文収集・管理、参考文献の瞬間作成 | 論文 | URL |
GoodNotes5 | PDF書き込みノート | 論文 | URL |
bioRχiv | 生命科学系査読前論文のデータベース | 調査 | URL |
PubMed | 生命・薬・医学系論文のデータベース | 調査 | URL |
BioCyc | pathwayのデータベース | 調査 | URL |
KEGG | システム・ヘルス・ゲノム・ケミカル | 調査 | URL |
生命科学データベース横断検索 | 散在するデータベースを検索 | 検索 | URL |
Integbioデータベースカタログ | 生命科学系データベースの検索 | 検索 | URL |
統合TV | データベース・ツールの使い方を学習 | 学習 | URL |
各ツール名をクリックすると、ツールのホームページに遷移します。
●概要:タンパク質の構造解析ツール
●使用例:タンパク質の構造から機能予測をする。progress report等でタンパク質の図を使用する。
●コメント:使い方は大きく2つあります、1つ目はAlphaFold PDBに掲載されたデータを見ることです。よく調べられているタンパク質に関しては既に予測されたデータが保管されているのでまずはこちらを見てみることをお勧めします。2つ目は自分でAlphaFold2を走らせる方法です。PDBに欲しいタンパク質のデータがなくてもアミノ酸配列(NCBIからとってきましょう)さえわかればgoogleサーバーを使用して計算可能です。このとき自分のPCのスペックはほとんど関係ありません。ちなみに無料版だと1000aaまでなら予測可能です。
●概要:primerの設計ツール
●使用例:primerの設計
●コメント:鋳型配列やTm、長さなどを入力すれば10パターンほどprimerを設計してくれます。個人的にprimerはいろんな設計ツールを試したのですが、一番バンドがくっきり出たのはprimer BLASTで設計したものでした。上記に挙げたもの以外の細かなパラメーターを設定することも可能です。設計に10分程かかることもありますが、早いときは2,3分で結果が出力されます。後述の統合TVでも動画で使い方が解説されています。
●概要:専門用語(technical terms)の和英・英和辞典ツール
●使用例:論文に出てきた専門用語の検索
●コメント:論文に出てきた専門用語の検索ができます。生命科学系の論文は当たり前のように専門用語が飛び交います。初めのうちは調べることが多く、読むのに時間がかかります。似たような論文を読み進めると何となく意味が分かる単語もありますが、辞書で調べてしまったほうが正確で早いです。
●概要:高精度な翻訳ツール
●使用例:論文の日本語訳。PR・JRの英訳等
●コメント:文章をコピペするだけで翻訳可能です。無料版だと3000文字までなら1回で翻訳できます。有料版にすればPDFを読ませるだけで日本語論文が生成できます。英語にあまり自信がない、短い期間で大量に論文を読まなければいけないときに便利です。
●概要:文章から改行などを除くツール
●使用例:PDF等の文章から改行を除いたテキストデータを生成しDeepL翻訳にかける
●コメント:ShaperにPDFからコピーした文章をペーストするだけです。DeepLで翻訳ボタンまでついているのでとても便利です。DeepLを無料で使い倒したい人にお勧めです。
●製品ページ
●概要:文献管理と参考文献リスト作成ができるツール
●使用例:文献収集・管理、参考文献リストの瞬間作成など
●コメント:文献情報やフルテキストPDFなど様々なファイルが一元管理できるツールです。同期機能で場所を選ばず自分のライブラリへアクセスできるほか、ドラッグ&ドロップでWord上に参考文献リストを一瞬で作成もできるので、論文作成・文献調査にかかる手間や時間を大幅にカットできます。
●概要:PDFに手書きで書き込めるノートアプリ
●使用例:論文や資料に手書きでコメントやポンチ絵を描く
●コメント:手書き入力ができるノートアプリです。ページ単位で情報が整理でき、PDFへの書き込み機能、キーワード検索機能もあります。クラウドにノートデータが保存されるので見返しやすくなっています。1500円の有料アプリでiOS/iPadOSにしか対応していませんが、Apple School Managerを利用している教育機関であればフルバージョンを無料で利用できます。(1500円で無限のノートが手に入ると考えればとても安いです。)iPadの場合はペーパーライクフィルムを画面に張ると紙で書いている感覚で書き込めます。
各データベース名をクリックすると、データベースのページに遷移します。
●概要:査読前の論文を読むことができるデータベース
●使用例:読みたい論文が有料版しかないときの代替検索
●コメント:bioRχivは生物系の査読前論文(preprint)の貯蔵庫(repository)です。非常に便利で使い勝手が良いですが1点注意が必要です。それは査読前の論文であるという点です。学術雑誌に載る論文は査読(専門家に論文の内容が妥当であるか精査)されています。しかし、査読を受けていないものは玉石混合です。そのためbioRχivで最初から探すのではなくgoogle scholarやPubMedから探すのをお勧めします。
●概要:生命・薬・医学の論文データベース
●使用例:論文検索
●コメント:PubMedは検索性の高い生命科学系論文のデータベースです。キーワード検索の後に出版年、無料ですべて読めるか、どの雑誌に載っているかなど絞り込みも可能です。生命科学系の論文を調べるなら最初はPubMedがお勧めです。論文検索の際は科学雑誌のimpact factorも気にしてみましょう。impact factorはある雑誌に掲載された論文が直近の2年間で平均どれくらい引用されたかを表す尺度です。その雑誌がどのくらいホットな研究の論文を掲載しているかがわかります。(impact factorはWeb of Scienceに収録されている雑誌のみが評価対象です。PubMedのようなデータベースにはimpact factorはありません。)
●概要:さまざまな生物のpathwayをまとめたデータベース
●使用例:pathwayを調べる・生物ごとに比較する
●コメント:このサイトには大腸菌からヒトまで2万以上の生物中心のゲノムと代謝経路に関するデータベースがあります。各データベースは、生物のアノテーションされたゲノムから計算機的に生成されます。その後、データベースは文献に基づく手作業のキュレーションを受けた量によって階層化されます。
Tier1:1人年以上のキュレーションを受けたデータベース
Tier2:1人年未満のキュレーションを受けたデータベース
Tier3:純粋に計算機で作成されたデータベース
データベースは、遺伝子名、タンパク質名、および多くのプロパティで検索可能で、サマリー、図、査読付き文献へのリンクでわかりやすく構成されています。
EcoCyc(大腸菌)、MetaCyc(代謝経路、代謝物、反応、酵素、遺伝子のデータベース)はアカウントの作成が必要ですが無料でアクセスすることができます。
その他のコンテンツはすべて購読が必要です。学生や研究室単位でフルアクセスをしたい場合はこちら。
BioCycを授業で使用したい場合はこちらから無料でフルアクセスを申し込むことができます。
●概要: 生物のシステム・ヘルス・ゲノム・ケミカル情報のデータベース
●使用例:代謝経路や遺伝子・タンパク質・疾患などについて調べる
●コメント:KEGGは生物の部品から組織、個体、エコシステムのような小規模~大規模まで様々な情報がまとめられたデータベースです。様々なデータがあるのですべてを使い切るのは難しいですが、自身の研究分野にかかわる部分を見るだけでも概要の理解につながります。特にpathway mapはおすすめです。
各検索ツール名をクリックすると、検索ページに遷移します。
●概要: キーワードをもとに散在するデータベースコンテンツを検索できるサイト
●使用例:ゲノム、遺伝子、タンパク質や学会要旨、用語、図鑑など幅広いコンテンツを網羅的に調べる
●コメント:自分の欲しい情報がどのデータベースに載っているかわからないときにお勧めです。遺伝子名やタンパク質名で網羅的に検索が可能で、検索結果からデータベースの種類を絞り込むことも可能です。国内の大学や研究機関を中心に790のデータベース(2023年6月7日現在)から一度に検索できるので、自身の研究に合ったデータベースを見つけることもできます。
●概要: 生命科学系データベースの検索サイト
●使用例:データベースを検索する。類似データベースを調べる
●コメント:生物種や知りたい対象、取得したいデータの種類から国内外のデータベースが検索できます。類似データベースもサジェストしてくれる上にデータベースの稼働状況(更新状況)やデータのDL可否からも絞り込むことができます。統合TVで使い方が紹介されていればそのリンクまで出てくるので至れり尽くせりのサイトです。
●概要: データベースやツールの使い方を動画で紹介してくれるサイト
●使用例:データベースやツールを使い方と合わせて知る
●コメント:有用なデータベースや研究用のツールを動画形式で紹介してくれるサイトです。キーワード検索以外に、用途に合わせたカテゴリ別検索や視聴ランキングもあります。図表の作成、Gmailの使い方から専門的な研究用ツールの使い方まで動画でわかりやすく解説されています。海外サイトやデータベースも日本語で解説しているので使ったことのないツールでも使用ハードルを大きく下げることができます。
生命科学系の学生向けに14種類ほどツールやデータベースを紹介させていただきました。冒頭でも書かせていただきましたが、生命科学は「いかに情報を整理して自身の研究にどう活用するか」が重要です。そして過去の研究を調べ、自分で実験をしてもわからないことが必ず出てきます。そんな時は先生や研究室のメンバーとディスカッションしましょう。自分の研究を説明する練習にもなりますし、思いもよらない発想で研究が進むこともあります。「論文読む・手を動かす・きちんと議論する」このサイクルをひたすら回していくと必ず良い研究になります。
この記事を読んで「よい成果が出た」や「こんなツール・サイトも便利だよ!」という情報があれば、下記お問い合わせフォームからこっそり教えてください。また紹介することがあるかも......しれません。