Mantraのメンバーら。左下が代表取締役の石渡祥之佑氏 提供:Mantra
Mantraのメンバーら。左下が代表取締役の石渡祥之佑氏、左上が最高技術責任者の日並遼太氏 すべての画像提供:Mantra
  • “マンガ専用の機械翻訳システム”を独自開発
  • 人と機械の融合で翻訳スピードを2倍に
  • 多言語展開における「スピード」と「コスト」の課題解消へ
  • マンガにおける言語の壁を取り払う

システム上にマンガの原稿データをアップロードして、タイトルと翻訳したい言語を選択するだけ。そうするとすぐに自動翻訳が始まり、1ページあたり約10数秒のペースで次々と翻訳が進んでいく。ページ数にもよるが、だいたい数分あればマンガ1話分ができあがるーー。

2020年1月に東京大学出身の2人の研究者が立ち上げたMantra(マントラ)が作ろうとしているのはマンガ専用の機械翻訳システムだ。

6月に日本で有料プランをスタートした「DeepL」を筆頭に、自動翻訳サービスの精度は年々進歩を遂げている。ほんの数年前は翻訳サービスを使っていると「何でこんな訳になったのだろう」と思うことも珍しくなかったのに、今ではそう思うことも随分と減った。

一方で分野によっては「特化型の翻訳エンジン」がなければ機械による翻訳がなかなか進まないものもある。今回のテーマである「マンガ」もまさにそうだ。特殊なフォントに独特の話し言葉、ストーリーの背景にある文脈。マンガの自動翻訳にはビジネス文書などとは違ったハードルがいくつも存在する。

Mantraはそんな難題に取り組むスタートアップの1つ。7月28日にマンガ専用の多言語翻訳システム「Mantra Engine」をローンチした。

このシステムでは自動翻訳された内容にプロの翻訳家が手を加えていく「人と機械のハイブリッドモデル」を採用することで、マンガの多言語展開を従来よりも安価に、スピーディーに実現することを目指している。

「Mantra Engine」の動作画面 ©️Kuchitaka Mitsuki

“マンガ専用の機械翻訳システム”を独自開発

機械翻訳における最初の関門は「正確な文字認識」だ。

マンガでは作品ごとに多種多様なフォントが使用され、時には線の上に文字が書かれていたり、白抜きで文字が表現されていたりもする。だからこそ背景や文字を正しく認識し、何が書かれているのかをきちんと読み取る技術が欠かせない。

そこでMantraではマンガ専用のOCR(文字認識)エンジンを自社で作った。あらかじめ数百種類の「フォント」と、背景になる「絵」のデータを用意。それらの組み合わせによって何パターンもの人工的な学習データを“自動生成”できる仕組みを構築し、マンガの文字認識に特化したOCRエンジンを完成させた。

「Wordで作った文書や紙の名刺を高精度で認識できるOCRエンジンが、マンガにおいても同じように上手くいくわけではありません。すごく難しい技術を使っているわけではないですが、認識したいドメインに合わせて専用の文字認識エンジン自体を設計することが重要だと考えました」(Mantra代表取締役の石渡祥之佑氏)

認識されたテキストを翻訳される工程でもいくつもの工夫が見られる。たとえば「マンガっぽい会話文やテキスト」を自然な表現に訳せるように学習データの作り方を模索した。

マンガ特有の表現を残したまま訳すには、汎用的な翻訳エンジンではなくマンガ専用の翻訳エンジンが必要になる。専用の翻訳エンジンを作るには専用の学習データを用意しなければならないが、このデータを用意するのにコストがかかり、マンガの自動翻訳を実現する上で1つのボトルネックになっていた。

Mantraの場合は既刊マンガの日本語版と外国語版の画像データを読み込ませるだけで、吹き出しを認識して自動で対訳テキスト(ペアになる日本語と外国語)を抽出する技術を開発。膨大なコストをかけずとも、学習データを効率良く集められる仕組みを作った。

翻訳する段階では翻訳エンジンだけでは不十分で、マンガの構造や文脈を理解することも求められる。

一例をあげると、マンガでは「1つのセリフが複数の吹き出しに分割されている」シーンがよく出てくる。このようなセリフをきれいに訳すには「『コマ』というマンガの構造を理解し、吹き出しの順番などを把握した上で、自然な語順になるように調整する必要がある」(石渡氏)という。

単文ごとに切り分けて翻訳してしまうと、吹き出しを順番に読んでいった際に不自然な訳になってしまうからだ。

Mantra Engineの文脈認識のイメージ。左の元原稿に対して、まず5つのコマを検出(中央)し、さらにコマ内の「吹き出し」の順番を自動で認識(右)する
Mantra Engineの文脈認識のイメージ。左の元原稿に対して、まず5つのコマを検出(中央)し、さらにコマ内の「吹き出し」の順番を自動で認識(右)する ©️Kuchitaka Mitsuki

人と機械の融合で翻訳スピードを2倍に

Mantraの共同創業者である石渡氏と日並遼太氏(最高技術責任者)は共に東京大学の情報理工学研究科で博士号を取得している。石渡氏は自然言語処理、日並氏は画像認識が専門領域だ。

マンガは絵とテキストが混ざり合っているため「これは誰のセリフなのか」「吹き出しの順番はどうなっているのか」といった情報は、自然言語処理と画像処理の両方を使って認識している。

石渡氏はまだまだテクノロジーを活用できる余地があると感じている一方で、自分たちが研究者であるがゆえに「技術だけではできないことも十分に認識しているつもりです」とも話す。

「ストーリーを考慮しながら、文脈を踏まえて翻訳するのは難しいです。本来はキャラクター性や前巻までのストーリーを加味して翻訳できるのが理想的ですが、まだそこまではできていません。マンガは省略されている情報も多くイラストからそれを汲み取らないといけない時もありますし、人の名前や技の名前など、作品ごとの固有名詞をどのように訳すのかという問題もある。人にしかできないクリエイティブな作業も間違いなく存在します」(石渡氏)

冒頭で触れた通り、Mantra Engineのスタンスは全てを機械で翻訳するのではなく「機械と人間の翻訳家がタッグを組む」ことで翻訳スピードを上げ、より多くのマンガをリアルタイムで世界に届けられる仕組みを実現しようというものだ。

そのためMantra Engineには機械翻訳エンジンだけでなく、翻訳家や出版社・マンガ配信サービス事業者の関係者をアシストするCMS(コンテンツ管理システム)のような機能が搭載されている。

翻訳家は自動翻訳された内容をチェックしながら、ブラウザ上でそのまま修正や校閲をする。今までWordやPDFなどを使いながら何往復もしていた関係者間での確認作業やフィードバックのコメントも、Mantra Engineでは一箇所に集約できるため無駄な作業が少なくて済む。

あくまでMantraが試した結果ではあるものの、従来の翻訳版制作のワークフローと比較してMantra Engineを使った場合には約半分の時間で翻訳版が制作できたそう。これは翻訳作業そのものだけでなく、前後に発生するコミュニケーションやオペレーションが効率化された効果もあるという。

直近では固有名詞の訳し方を「用語集」に登録しておくことで、それ以降の機械翻訳に自動で適用される機能なども追加された。

多言語展開における「スピード」と「コスト」の課題解消へ

「翻訳スピードが2倍になると、今まで1話分の翻訳版を制作するのに2週間かかっていたところが1週間に短縮されます。1つの事例としてイメージしているのは、Mantra Engineを使うことで週間連載に合わせて翻訳活動ができるようになること。日本語版と同時に他の言語でも出版できるようなスピード感です」

「そうなると海外のマンガファンはいち早く最新話の正規版を自分の言語で楽しむことができ、コンテンツホルダーは最速で多言語展開できるようになる。『翻訳版を発売するまでの間に海賊版が出回ってしまいお客さんを奪われる』ということもなくなります」(石渡氏)

これまでマンガの多言語展開においては「スピード」と「コスト」がネックになってきた。

石渡氏の話では単行本1冊を1つの言語に翻訳するだけで20〜30万円ほどかかるのが一般的であるため、本当に売れると判断されたものでなければなかなか翻訳版は制作されない。結果的に日本で単行本が出版された後、海外の出版社から声がかかってライセンス部門が対応するというケースが多く、海賊版が先に出回ってしまっている状況だ。

Mantra Engineを作るにあたって海外のユーザーに「なぜ海賊版を使っているのか」ヒアリンをしたところ、「読みたい作品が自分たちの言語でなかなか出てこないから」「そもそも自分たちの言語に対応したものがないから」という回答が最も多かったという。

漫画翻訳にかかるスピードやコストの課題を解決できれば、海賊版を撲滅させるきっかけになるかもしれない。集英社が展開する全世界対応のマンガアプリ「MANGA Plus」のような先行事例が出てきたのも大きいだろう。

「正規版がスピーディーに翻訳されて、リーズナブルな価格で楽しむことができるならお金を払って読みたいという反応も少なくありませんでした。個人的な見立てではありますが、ヒアリングをしている限りでは全体の30〜40%ほどの人は正規版があればそれを読んでくれるのではと考えています」(石渡氏)

海賊版の問題に限らず、海外へ販路を拡大したいと考える事業者が増えてきていると石渡氏は感じているそう。特に電子版であれば海外に直接的な販路を持っていなくても海外展開が可能であり、流通の状況に左右されることもない。新型コロナウイルスの影響なども相まってか、特にこの半年の間だけでも「多言語化への関心が高まっている印象」だという。

ローンチ時点でMantra Engineが対応する言語は英語と中国語(簡体字)のみだが、今後順次追加していく予定だ。

マンガにおける言語の壁を取り払う

Mantraではプロダクトローンチに先駆けて、6月にAI特化型のインキュベーター・ディープコアやDMM.com(DMM VENTURES)などから約8000万円の資金調達を実施した。当面はこの資金も活用しながら、法人向けにマンガの多言語展開をサポートしていく方針だ。

「会社としてやりたいのは『マンガを世界に届けること』。理想的には世界中のマンガが発売されると同時にいろんな言語で楽しめるような環境を作りたいと思っています」(石渡氏)

もともとMantra創業者の2人は博士課程在籍中にそれぞれが海外でインターンシップに参加。その際に他国の学生と日本のマンガやアニメの話で盛り上がり打ち解けた経験が、この領域で事業を立ち上げるきっかけの1つになった。

「母親が中国人のため、子どもの頃から中国に行く機会が何度もありました。『日本のマンガやアニメは人気なので世界中どこに行っても通じる』という話はいろんな人から聞きますが、自分自身も幼い頃から同じような経験をしてきました。だからそのようなコンテンツの流通を加速させるようことをやりたいという思いは以前からあったんです」(石渡氏)

SNSや漫画投稿サービスが普及し、名もない個人が自分で描いた作品を社会に対して気軽に発表できるようになった。ゆくゆくは法人に限らずそういった個人が世界に対しても作品を配信できるようにサポートをしていきたいという意向もある。

「インターネットが普及したことによってコンテンツ流通における距離の壁は大幅に解消されましたが、言語の壁はまだまだ高い。マンガという領域においては、自分たちがその壁をなくしていけるようにチャレンジしていきたいです」(石渡氏)