実験作業の自動化を進めるとともに考えたいこと:翻訳ツールの話

2023.08.07

こんにちは!MIRA山本です!今年は例年以上に暑い夏になっていますね。

花火大会も本格的に再開したところも多く、甲子園もはじまって…そしてそろそろ束の間のお盆休みを考えている方も多いのではないでしょうか。

さて、これまで、主にロボットを活用したラボラトリーオートメーションということで、実際の実験作業の自動化で役立つ内容について書いてまいりました。

→「MIRA山本のラボ自動化コラム」過去シリーズはこちら

それらが進んでくると、実験作業の量的な確保、繰り返し作業の質の担保、危ない作業における危険回避などとともに、「研究者の時間の確保」についても恩恵が出てくることは理解いただけたと思います。

これからもどんどんラボラトリーオートメーションにおいて便利なもの、考え方など事例も交えながら発信していきたいと思いますが、今回はちょっと視点を変えまして、別の角度から「研究の時間確保」に便利なツールをご紹介したいと思います。

やっぱり慣れた言語のほうが早い

研究者の皆様は論文に目を通す機会も多いかと思います。学術雑誌・学会雑誌に掲載されているものや色々な文献データベースから成分、人物、アカデミアなど様々なワードで検索して論文を抽出したり、過去の所内・グループ内の実験データの紙媒体(特に紙が多く残っていることも特徴的かもしれません)から探したりと様々なものがあります。そして、それら論文の多くは、英語で書かれたものです。

研究の最前線で活躍される方々は英語力に長けており、あまり苦にならない方も多いですが、それでもやはり慣れた言語・母国語よりは時間もかかりますし、負荷が大きくなるために、母国語文章と比べると「読み飛ばし」を行っているそうです。そのため、多くはタイトル、アブストラクト、グラフ、構造式と数値指標について目を通しつつ、詳細な説明文章までは目を追っていないのが実態のようです。

実際の研究者の方々からお伺いしてみましたところ、習熟度合にもよりますが、ひとつの論文から読めている、得られている情報が母国語と比べると半分~それ以下程度になっているのではないか、という認識・実感のようです。



「翻訳」×「文字認識」×「自然言語処理」×『研究者に親切』

前章で挙げた、理解度に関する悩みを解決するには?もっともっと英語力を高めていくということは必要だと思いますし、本当に伝えたいものは原文、元の言語のままのほうが正しいということは言うまでもありませんが、やはりそれに追いつくには時間がかかりますし、リサーチにもある程度の速度が求められ、今すぐ知りたいことも多い・・という中、色々な翻訳ツールを使うことも多いかと思います。実際ここ数年、翻訳エンジンやブラウザも優れたものが多く出ています。

実際に各種翻訳エンジンを使われている方も多いでしょう。Web上で出ている文章であればどんどんコピー&ペーストをして翻訳させてということでページを2つのブラウザを並べて読んでいるといった方も多いのではないでしょうか。

ここのところ、会話に当たり前のように出てくるようになったChatGPTは専門的な質問については内容によって、現時点ではまだ比較的適合度の高いワードをマッチングさせようとして誤った回答が出てきてしまう可能性があるため、研究分野においては営業/マーケティング系の方と比べますと「様子見」~「ややネガティブ」な印象も多いそうです。ただこれもまだこれから成長していくプロダクトとして期待値は高いでしょう。(これを書いている間にも成長しているでしょうし)

そんな中、最近では研究者や技術者向けに論文にフォーカスして翻訳してくれる専門サービスなども出てまいりました。使い方のおおよそのフローとしては、翻訳したい論文を読み込ませて翻訳開始ボタンを押すと翻訳したファイルが生成されて保存が出来るといったもの。ここまでなら当たり前の機能かもしれません。

そして、さすが専用ソフトということで原文注釈が残せる、OCR技術も組み合わせることで普通にはコピー&ペーストしにくいスキャンデータ、配布資料のようなものでも文字認識を行ってくれて、そのうえで翻訳をしてくれるといった機能が実装されています。

ですから、表やグラフ以外の文章であれば自動的に連結して日本語化をしてくれるということで、ストレスなく海外の論文が読めるようになります。これは未だに紙面が多い研究者の中ではかなり便利な機能になっていると思います。

どうしても通常の翻訳ツールだとコピー&ペーストがうまくいかない、ペースト時に行が崩れる、まとめてコピーが難しいので小刻みに数行ずつ翻訳している、先のとおりそもそも紙面上の場合、カタカタと入力して訳している場合も…。こうした問題から、細やかな本文・説明補助となる箇所は読まれていないということがあったわけですが、こういったツールを用いることで、より精度、鮮度の高い情報が得られるようになります。

使える技術は使って、研究を効率化させていきましょう

まとめ

AIの進展によって自然言語処理や文字認識といったものは進化著しく、色々なサービス、アプリケーションが提供されています。また、そもそもITは情報管理、整理、検索をしやすい環境を構築することには強いわけですから、これらをうまく組み合わせて使っていくことでクリエイティブな研究の質も速度も高められていきます。

 

ロボットを活用したラボラトリーオートメーションは考え事をしたあとの実行段階と捉えていますが、「翻訳」は実はその前段階のところにおける、より便利なオートメーション技術であるともいえます。研究者の方がそういったものも積極的に活用し、慣れた母国語によって、よりストレスを軽減しながら多くの知見を得ていくことによって、よりよいアイデアを発想させる、そしてよりよいアイデアでロボットに実験作業をさせていくことでもっとクリエイティブで楽しいラボラトリーの構築、ひいてはよりよい研究サイクルを確立することが出来るのではないかと思います。

【MIRA山本 これまでの記事】

【著者紹介】山本 圭介

株式会社MIRA 代表取締役。ロボットメーカー、AIベンチャーにおける営業・事業企画・新規事業開発を経て、よりユーザーサイドにおけるオーダーメイド型の導入支援が行えればと考え株式会社MIRAを設立。
現在、医薬品メーカー等をはじめとした研究者の実験作業や分析、品質管理などで行われる各工程における産業用ロボット、協働ロボットやAIを組み込んだシステムの活用可能性の検討から構想支援、導入支援等のコンサルティングを行っています。一方で他メーカーのロボット関連製品やAIサービスの企画支援や営業支援、また、ユーザーに向けたロボットやAIに関する勉強会の開催やセミナー登壇を行っています。

このライターの記事一覧

 

近年研究や実験作業におけるシーンでもロボット等を用いた「自動化」の流れが強くなってきていると感じています。
このシリーズでは、工場だけでなく研究所等の様々な作業のロボット導入・DX導入に携わってきた私、MIRAの山本が、ラボの自動化・ラボラトリーオートメーションをテーマに、ロボットやAIの活用について楽しく解説していきます。