研究支援サービス「Sophiscope(ソフィスコープ)」
研究支援サービス「Sophiscope(ソフィスコープ)」

「多くの研究現場においては、先行研究を最大限に活用できていないのではないかと考えています」

そう話すのはライフサイエンス分野の研究者を対象とした研究支援サービス「Sophiscope(ソフィスコープ)」を開発するfuku代表取締役の山田涼太氏だ。

Sophiscopeでは世界中に散らばる膨大な数のライフサイエンス論文を整理し、研究者が必要な先行研究に効率的にアクセスできるように手助けをする。自然言語処理と機械学習技術を用いて論文の内容を構造化し、すべての実験条件を同じフォーマットで扱えるようにすることで、さまざまな論文を横断で比較できる仕組みが特徴だ。

第1弾として“がんの移植実験”の領域に絞ったオープンベータ版サービスを10月14日に公開した。このプロダクトを使えば10万件以上の論文を対象に、条件に合った先行研究を迅速かつ高精度で抽出できるという。

山田氏によるとライフサイエンスの研究では予備実験(試薬の量・反応時間など適切な実験条件を調整するための事前に行う実験)にかなりの負担がかかっており、この工程を効率化することがSophiscopeの目的の1つだ。

fukuが研究者に実施したヒアリングでは本実験(論文に掲載するデータを取得する実験)までに平均3回以上の予備実験を行っている上に、新しい研究テーマに取り組む際にはこの予備実験の前段階で平均27本の論文を調査し、実験条件の検討に86時間ほどを要していることが分かったという。

特に現場の研究者にとって重たい作業になっているのが、膨大な先行研究の中から自分たちの目的に合致した論文を見つけ出してくること。従来は主に「PubMed」や「Google Scholar」などの論文データベースが使われてきたが、これらのデータベースはあくまで論文をキュレーションしたサービスであり、構造上「内容面も踏まえた検索」が難しい。

著者名や年度などのメタデータで検索するのには向いている反面、本文にしか書かれていない具体的な実験条件を探すのには非効率だというのが山田氏の見解だ。

結果として大雑把なキーワードで対象となりそうな論文にあたりをつけた後は、1つずつ中身を目視でチェックしてエクセルなどにまとめていく必要があるのだそう。それでは作業時間がかかるのはもちろん、論文調査の精度が悪くなることで、予備実験の回数自体が増えてしまうことにもなる。

「人が手探りで調査をしなければならないため、限られた情報源にしかあたることができません。予備実験のスタート地点が悪ければ、どうしてもゴールにたどり着くまでに工数がかかってしまいます。もし過去の研究から自分たちにとって最適なものを抽出してきて正しい判断をする仕組みがあれば、調査にかかる時間を減らせるだけでなく、予備実験の回数自体も減らせるのではないかと考えました。そうなれば、研究者も『創造的な研究活動』により多くの時間を使えるようになります」(山田氏)

そのような背景から、山田氏は冒頭でも触れた論文の横断検索プラットフォームSophiscopeを開発した。

Sophiscopeではすべての実験条件を同じフォーマットで扱えるようにすることで、さまざまな論文を横断で比較できる仕組みが特徴
Sophiscopeではすべての実験条件を同じフォーマットで扱えるようにすることで、さまざまな論文を横断で比較できる仕組みが特徴

山田氏がポイントの1つに挙げるのが「データの正規化」だ。論文はあくまで人が読んでわかるように人間の言葉で書かれているため、薬の名前やマウスの名前などに関して同じものを指していても表記が異なる場合があり、シンプルな検索エンジンでは検索結果から漏れてしまうことがあった。

そこでfukuでは薬やマウス、がん細胞などそれぞれの要素に対して「オントロジー(言葉の辞書のようなもの)」を用意し、表記ゆれを吸収して検索できる仕組みを整えている。

「論文の検索を迅速かつ高い精度で行うには、あらゆる論文を同じフォーマットで扱えることが重要です。この仕組みを実現できると、今までは人が時間をかけてやっていた作業を機械的に実行できるようになります」(山田氏)

山田氏は子供の頃から動物が好きだったこともあり、大学は獣医学を学ぶために東京大学農学部獣医学専修に進学した。ただ、そこで山田氏自身はサイエンスの現場における実験の非効率性を自ら体感することになる。

fuku代表取締役の山田涼太氏
fuku代表取締役の山田涼太氏

“必要のない動物実験”の数を減らしたい──。そのような考えから最初はARを活用した動物実験のプロダクトなどのアイデアを考えていたが、ちょうどその頃出会ったプライマルキャピタルの佐々木浩史氏などとディスカッションをする中で、「予備実験を減らすために、先行研究を調べる際の課題を解決すること」に着目し、Sophiscopeのプロトタイプを開発した。ちなみに山田氏はライフサイエンス業界にテクノロジーを導入する必要性を感じ、工学部へ転学部して自ら自然言語処理の技術などを学んだのだという。

オープンベータ版では対象疾患をがんに絞っているが、今後は糖尿病や認知症、AIDSなどにも拡大する予定。実験条件の抽出を足がかりに、将来的には論文の再現可能性の測定、実験条件の提案、実験結果のシミュレーションといった機能も実装していく計画だ。

それに向けてfukuでは10月14日にプライマルキャピタル、ディープコア、個人投資家の島田達朗氏を引受先とした第三者割当増資により総額4500万円の資金調達も実施した。

この資金を活用して人材採用を強化する方針。まずは製薬企業の研究者が日々の業務で使えるサービスとして展開していくことを目指す。