
- 「ぎこちない翻訳」を一変させたGoogleのニューラルネットに基づく機械翻訳
- 増え続ける言葉、国や状況によって変化する言い回し
- 翻訳ツールが進化すれば、情報の流れはより早くなる
「わからない言葉は、いったん“翻訳”にかけてみよう」──そうして多くの人が当たり前のように使用しているサービスがGoogle 翻訳だ。
翻訳だけでなく、検索やメール、マップなど、今や私たちの生活に欠かせないツールを数多く生み出してきたGoogle。その日本法人が設立から今年で20年を迎えた。
そんなGoogleのツールのひとつに「Google 翻訳」が登場したのは、2006年のこと。当時は漫画『ドラえもん』に登場するひみつ道具「ほんやくコンニャク」を彷彿とさせるサービスとなるか、と期待もされたが、現実はそう簡単にはいかなかった。リリース当初は「なんか思っていたのとは違う」といった、ぎこちない翻訳も多かった。明らかにおかしい翻訳内容はTwitterで話題になることもあった。

そんな状況を一気に打破するきっかけになったのが、2016年に採用したニューラルネットワーク(人間の脳神経系を模した情報処理システム)に基づく機械翻訳だったという。それによって、ユーザーの期待値はどのように変わったのだろうか。
また、インターネットで新たな“ネットスラング”などが登場するなか、Google翻訳に求められる役割とは何か。開発を担当する賀沢秀人氏に15年の歩みを聞いた。
「ぎこちない翻訳」を一変させたGoogleのニューラルネットに基づく機械翻訳
そもそも、今ではほとんど見られなくなったGoogle 翻訳の「ぎこちなさ」はなぜ生み出されていたのか。賀沢氏によれば、当初のGoogle 翻訳では「フレーズベース機械翻訳」と呼ばれるシステムが採用されていたという。これは文中の単語やフレーズを個々に翻訳するスタイルだったため、冒頭でも触れたように「ぎこちない翻訳」となることが多くなっていた。
「ご存じのとおり、言語は多様であり、かつ複雑です。翻訳するにはさまざまなルールを付け足す必要がありました。それを、人間だけで対応するのは不可能。そこで、フレーズベース機械翻訳であらゆるデータをカバーしようと考えたのです」(賀沢氏)
ここで、思わぬ壁と向き合うことになる。フレーズベース機械翻訳は、単語や句の訳は得意なものの「どんな順番で一文にすればいいのか」が難問だった。その最たる例が、語順も文法も異なる日本語と英語の翻訳だ。この関係性によって、「ぎこちない翻訳」が誕生していた。

データを揃えつつ、地道に改良を加える日々が続く。そのスピードは「三歩進んで、“半歩”下がる」ようなものだった。そんな状況をガラリと変えたのが、冒頭でも触れたニューラルネットワークだ。
「ニューラルネットを取り入れたGoogle 翻訳は、データの中から自動的に翻訳のためのモデルを作ります。文章全体を鑑みて訳すので、文脈に沿った自然な翻訳ができるんです。おかげで、ぎこちない翻訳は大幅に減りました」(賀沢氏)
ニューラルネットに基づく機械翻訳の導入後、英語からフランス語、そして英語からドイツ語の翻訳で、誤りを平均60%低減させるなどの結果を見せた。

Googleとしては試験運用期間を経てから、正式にニューラルネットに基づく機械翻訳の導入を発表するつもりだった。ところが、ユーザーがGoogle 翻訳の変化にいち早く気づき、2016年11月ごろから、Twitterなどで「翻訳の質が良くなっている」と騒ぎ始めたという。
「とても驚きましたね。そして、翻訳の質が良くなればすぐに気づいてもらえるんだと手応えを感じました。ニューラルネットに基づく機械翻訳の導入は、めったにない技術のブレイクスルーだと思っています。僕自身も、技術が進歩すると見える景色が変わるのだと体験できました」(賀沢氏)
増え続ける言葉、国や状況によって変化する言い回し
サービスは、ニューラルネットに基づく機械翻訳を採用して終わり、とはならない。
このシステムを使っても、完璧な翻訳ツールになるまでの試行錯誤はまだ続いている。翻訳の精度は格段に上がったが、学習データの量や質によっては、誤った翻訳になることもある。賀沢氏も「『なぜうまくいかないのか』と思うことは今もあります」と話す。
「翻訳の難点は、ユーザーが置かれている状況次第で意味合いが変わるところです。例えば、伝えたい相手が上司か友達かによって、言い回しは変わります。でも、文章を入れて翻訳するだけでは、そういった背景を拾いきれないんですよね」
「さらに、日本語には尊敬語や丁寧語があり、身内に対しては敬称を付けないルールもあります。日本語に限らず、英語でも単語によって独特の言い回しがあったり……。そういったところもカバーできるようになれば、より信頼性は高まりますよね」(賀沢氏)

リリース当初は「いろいろ翻訳できて便利」と言われていたが、今では『なぜ翻訳できないんだ』と言われるケースが増えている。また、「翻訳は『使ってみないとわからない部分』が多い」と賀沢氏は言う。
「Googleには検索機能やデバイスなど、さまざまなプロダクトがあります。ニューラルネットに基づく機械翻訳の採用、そして音声認識の質も向上したこともあり『こういう使い方はできないか?』という問い合わせも増えました。質が向上することで、新たに使い方を発見してもらえるのが翻訳ツールの特徴です。今後は、プロダクトとのさらなる掛け合わせで、活用の機会がぐっと増えると思っています」(賀沢氏)
翻訳ツールが進化すれば、情報の流れはより早くなる
世の中は常に変化する。同時に、新たな言葉も生まれ続ける。Google 翻訳が「完璧な翻訳」を目指す限り、質の追求に終わりはない。
「僕らとしてはGoogle 翻訳を使っていただきたいですし、正しく翻訳したい。なので『これは訳せなくていい』と言える立場ではないんですよね。世界中では、今も新しい言葉が生まれ続けています。その反面、使われなくなる言葉も出てくる。その両方をキャッチアップしながら精度を高め続けるのは、難しいチャレンジでもあります」
「新しい言葉を見つけるだけでなく、一部のコミュニティで使われる言葉にも敏感ではなくてはならない。そこに『海外へ発信したい』気持ちがあればできるかぎりサポートできるようにしたいんですよね」(賀沢氏)
いかに言語をサポートできるかが、Google 翻訳の信頼性へ直結する。言葉が自由になれば、当然ながら行動範囲が広がる。そのため「今後は翻訳ツールとしての進化はもちろん、活用の場も考えなくちゃいけない」と賀沢氏は語る。
現在では、Google 翻訳以外にも「DeepL翻訳」など他社の翻訳サービスも続々と登場している。その状況を、賀沢氏はどう感じているのか。
「さまざまなサービスが登場することは非常に良いことです。他社サービスが増えているということは、それだけ活用の場があるということ。活用の場が広がることで何が起こるのかはまだわからないけれど、ワクワクしますよね。今後は確実に翻訳コストは下がり、情報の流れがよりスムーズになることはわかります。今まで言葉の壁がネックだったところへ、情報が届き始めるイメージです。Google 翻訳の進化によって世の中がどう変化するのか、個人的にも非常に興味がありますね」(賀沢氏)