
- ユーザーの英語をAIが音声矯正、AI講師と実践会話を学ぶ仕組みも導入
- 読み書きできても「話せない」を解決
- 「AIが相手なら恥ずかしくない」
- 日本版ローンチから約1カ月「成長スピードは想定以上」
日本でも連日話題を呼んでいる「ChatGPT」の開発元・OpenAI。この機関はOpenAI Startup Fundというファンドを通じて、先進的なAIスタートアップに投資をしていることでも知られる。
AIを活用して英語学習に変革を起こそうとしているSpeakeasy LabsはそんなOpenAI Startup Fundの投資先の1社だ。同社が韓国で展開してきた「Speak(スピーク)」は2020年に100万ダウンロードを突破。現在はアクティブな有料会員を10万人以上抱える人気アプリに成長しており、年間収益は数千万ドル(数十億円)規模に上る。
2022年11月にはOpenAI Startup Fundなどから2700万ドルを調達し、2023年2月からは日本版の展開も始めた。
スピークはAIとの対話を通じて英会話を学べるスピーキング特化型のアプリだ。従来の英会話教室やオンライン英会話サービスでは“人間の講師”との会話を通じて英語を学ぶが、スピークの場合はその相手が“AI”になる。
アプリを開いて英語を話せば、AIが音声を認識し、フィードバックをくれる。スマートフォンさえあれば時間や場所を問わず自由にスピーキングの特訓ができ、AIが相手なので予約の手間もなければ、英語を話すことの“恥ずかしさ”などもないのが特徴だ。
英語学習の領域にはすでに複数のサービスが存在していた中で、なぜスピークはここまでの成長を遂げることができたのか。
Speakeasy Labsで日本代表を務めるYan Kindyushenko (キンジュシェンコ・ヤン)氏にサービスの特徴や現状、そして今後の日本展開について話を聞いた。
ユーザーの英語をAIが音声矯正、AI講師と実践会話を学ぶ仕組みも導入

スピークは「レベル別コース」「AI講師」「ミニコース」の3種類のコンテンツで構成されており、全てに共通するのがスピーキングに特化した内容になっていること。「発話量が多くなるように設計されているのが1つのセールスポイント」(ヤン氏)であり、20分で約1000単語(1センテンス=約10単語として算出)を話せるという。
特徴的なのが、2022年12月にリリースしたAI講師だ。この機能では「ホテルでのチェックイン」や「レストランでの注文」など、さまざまなシチュエーションにおける英語を実際にAI講師と会話をしながら学んでいく。

ホテルであれば「チェックインしてルームキーを受け取る」といったかたちで各シチュエーションごとにいくつかのミッションが用意されており、それらをクリアしながら会話を進める形式。ユーザーの発言内容に応じてAIの返答も変わるため、実際の会話に近い。
レッスン終了後には使用した単語の数やスコアが表示されるほか、発音や文法などに関して改善点がある場合にはAIからのフィードバックももらえる。
スピークの基本機能であるレベル別コースでは、その名の通り自身の英語レベルに合わせてコース形式で段階的に英語を学べる。この機能では講師のレクチャーの後にユーザーが単語やフレーズを話すと、その音声をAIが認識して矯正するという流れでレッスンが進む。
とにかくスピーキングの頻度が多く「講師にならって英語を話し、その内容を逐一AIにチェックしてもらう」というプロセスを徹底的に繰り返す仕様になっており、約1カ月間で1コース分の英単語やフレーズを習得できる。
ミニコースは会議で多用される表現や英語独自の言い回し、発音の強弱の付け方などを短時間でピンポイントで学べる機能だ。
スピークは月額または年額のサブスクリプション型で、プレミアムプランは月額1800円。レベル別コースやミニコースは全プランで無制限に使えるが、AI講師によるレッスンは話した単語1つにつき1クレジットが必要となり、プランごとに付与されるクレジットの数が変わる仕組みだ。

読み書きできても「話せない」を解決
Speakeasy LabsはConnor Zwick氏とAndrew Hsu氏が2016年に創業した米国発のスタートアップだ。Zwick氏は生粋の起業家でそれ以前にも複数のサービスを開発。ハーバード大学を中退後、最初に立ち上げた教育アプリ「Flashcards+」を売却した経験を持つ。
共同創業者のAndrew Hsu氏は神経科学などを学んだ後、スタンフォード大学の博士課程に進学。最終的には同大学を中退してスタートアップの道を選んでいる。2人はともに著名投資家のピーター・ティール氏が手がける若者向けの起業家育成プログラム「Thiel Fellowship(ティールフェローシップ)」の出身だ。
2人はスピークを開発する前に1年間かけて機械学習の研究に取り組み、その過程で独自の音声認識アルゴリズムを作った。最初から事業アイデアありきで始まったわけではなく、技術ありきでスタートした会社であり、複数のプロダクトを試す中で現在のスピークにたどり着いている。

ヤン氏はスピークが韓国で多くのユーザーを獲得できた大きな要因として「1つのマーケットに特化したプロダクトを作り込んだこと」を挙げる。
「最初は機械学習技術を軸にしたプロダクトをグローバルで展開できないか考えていたものの、(同一のプロダクトを)異なる市場にフィットさせるのは難しく、なかなかうまく行かなかった背景があります。スピークが韓国で成長できたのは、韓国のカスタマーが求めているものを理解し、プロダクトやコンテンツを作り込んでいけたことが大きい。成長の要因はプロダクトマーケットフィットを実現できたことにあると思っています」(ヤン氏)
もともと韓国では英語学習の熱が高く、国内の財閥系を中心に英語が必須となる企業も少なくない。小学1年生から学校で英語の授業がスタートし、親も英語教育に熱心だ。
既存の英会話教室や英語学習サービスは存在するものの、ヒアリングをすると解決されていない課題が見えてきたという。
「英語の読み書きやリスニングはできても、話すことができない。たくさんのユーザーにインタビューをしてきましたが、それが1番のペインポイントです。この課題を解決するのに適したソリューションがなかったからこそ、スピークはユーザーを獲得できました」(ヤン氏)
テクノロジーを軸にした会社ではあるが、アプリに搭載するコンテンツにもこだわる。社内には「TESOL(英語の教授法、英語を教える資格)」を取得しているメンバーが複数人在籍。コンテンツ自体は米国で制作しており、現地で実際に使われている表現や語彙(ごい)を学べる内容を提供する。
上述したようにスピークでは最初に事例を聞いて、それをその都度実際に声に出して話すことで記憶に入れる。新しい語彙やフレーズを「早く定着させるための機能」も取り入れており、復習機能などを通じて「同じ表現を繰り替えすることで、長期で記憶して、通常会話でも使えるような状態を作る」(ヤン氏)仕組みを作り込んできた。

「AIが相手なら恥ずかしくない」
「使いやすさ」という観点でもアプリで完結することのメリットはいくつかある。
たとえば場所や時間の融通が効きやすい。対人型の英会話レッスンであれば講師のスケジュールが決まっているので、そこに合わせて予約をする必要がある。レッスンの枠も25分や50分など時間が決まっているケースが多い。
一方でスピークの場合は自分が希望する時間にいつでも学習を進められる。途中で中断して後から再開することもできるので、数分単位のスキマ時間でも学習可能だ。
また「AIが相手なので(自分が英語を満足に話せないことから)恥ずかしいと感じることや、気を使ってしまうことがなくなる」点は多くのユーザーから挙げられるポイントだという。
「(対人型のレッスンの場合)そこまで英語ができないと思って話すことが恥ずかしいと感じてしまったり、それが原因でスピーキング量がどうしても少なくなってしまう。そこに悩みを抱えている人は多いです。(スピークのようなアプローチは)日本人の性格にも適したかたちでスピーキングができると思っています」(ヤン氏)
AI相手でもスムーズに学習ができる仕組みとして、スピークでは音声認識技術を始めとした研究開発を続けてきた。まさにこの点こそ、OpenAIとの連携が活きてくる部分だ。
OpenAIとのパートナーシップにより、同社の最新技術をいち早く自社のプロダクトに組み込める。実際にOpenAIからの資金調達は資金の獲得よりも「パートナーシップを通じて得られる付加価値」(ヤン氏)が目的だったという。
「たとえばAI講師においては(AIとユーザーの)自然な会話をサポートするために多くの部分で『GPT-3』を活用していますし、音声認識技術に関しても独自開発した技術に加えて(OpenAIが手がける音声認識モデルの)Whisperを使っています。実はパートナーシップのきっかけの1つはWhisperの技術です。アクセントの癖の強い人のスピーキングをしっかり理解する上で、部分的にWhisperを活用しています」
「もちろん独自で蓄積しているデータを基にモデルを作り込んでいますが、OpenAIが保有しているデータの規模はかなり大きい。彼らの技術を借りることにより、プロダクトの開発スピードが早くなっている側面はあります」(ヤン氏)
※編集部注 : ヤン氏への取材は「GPT-4」の発表前に実施したもののため同技術に関する言及はなかったが、3月15日にSpeakeasy Labsより「2カ月以上前からGPT-4を活用してAI講師のサービスを提供していること」が明かされている。
日本版ローンチから約1カ月「成長スピードは想定以上」
Speakeasy Labsでは韓国に続くグローバル展開の場所として日本市場を選び、2022年10月のソフトローンチを経て2023年2月に日本語版の提供を始めた。今回日本語版のローンチに至った背景についてヤン氏はこう説明する。
「人口などを踏まえても日本市場は大きなマーケットであり、(これまで展開してきた)韓国と同じアジア圏で文化的に近いということも今回の判断に大きな影響を与えました。また英語の需要自体が日本で増してきていると考えています。日本企業の海外進出やリスキリングのニーズ、転職人材の増加などの流れがある中で、英語を勉強したい人自体が増えていることも背景にあります」(ヤン氏)
日本展開にあたっては国内でインタビューなどを実施しながら市場調査をし、日本人のコミュニケーションスタイルなどを踏まえてコンテンツの細かいシチュエーションや構成を作り込んできた。
2月にはAppStoreの教育カテゴリで2位に入り、3月には一時的に1位にもランクインした。ダウンロード数などは公開していないものの「ここまでの成長スピードは社内の予想を上回っており、事業計画を上方修正している」(ヤン氏)という。
「(ダウンロード数や有料会員数については)韓国を大きく上回ると見ています。人口比率などを踏まえても市場のポテンシャルとしては大きいですし、初動を見てもかなり手応えを感じています」(ヤン氏)
“英語学習サービス”という観点では、日本の市場にはすでにさまざまな選択肢が存在する。
英会話スクールやオンライン英会話サービスだけでも複数の種類があり、イーオンのように既存の事業者がAIを活用した学習アプリを展開するような例もある。メタバースやeスポーツ、マンガなど新しい切り口で英語を学べる仕組みを作るスタートアップも出てきた。
「(複数のサービスが存在すること自体は)あまり重要ではないと考えています。それはまだまだ大きな教育の変化は起きていないからです。もちろん英会話であればデジタル技術やアプリなどによって便利になっている部分はあります。でも、大きな革命と言えるような変化までは起きていないのが現状です。独自の技術やユーザー体験において大きな変化を実現できた会社が、本当の意味で初めて成功したと言えると考えています。スピークとしてもそこを目指して、今後も研究開発やプロダクト開発に取り組んでいきます」(ヤン氏)
グローバルでは、語学アプリを展開するDuolingoがGPT-4を搭載したサービス「Duolingo Max」を発表するなど新たな動きも見られる。さまざまな分野で急速にOpenAIの技術を始めとした生成AIの活用が進む中で、英語学習の方法においてもイノベーションが生まれそうだ。