
リモートワークの広がりに伴い、ビデオ会議ツールを使って会議や打ち合わせをオンライン上で実施することが珍しくなくなってきた。
2016年創業のEmbodyMeが3月31日にリリースした「xpression camera」は、そのビデオ会議における感情表現を豊かにするバーチャルカメラアプリだ。
このアプリではZoomやTeamsなどで会議をしている際、画面に表示される自分の外見を“他の人に置き換えて”会話ができる。
必要なものは「自分がなりきりたい人の写った画像素材」だけ。ビデオ会議で使用する場合にはカメラの設定をxpression cameraに変更することで、画像の中の人になりきり、自分の表情に合わせてリアルタイムで会話を楽しむことが可能だ。
画像素材には歴史上の人物や著名人、キャラクターなどだけではなく、自分の写真も使える。たとえばスーツ姿や身だしなみが整った状態の画像を用いて、パジャマの状態で会議に参加してみるのもいいかもしれない。

無料プランではサービス内にあらかじめ備わっているデフォルトの画像のみを使うことができ、自分で好みの画像を利用したい場合には有料プラン(月額8ドルまたは年額84ドル)への登録が必要だ。有料プランは背景画像の変更にも対応しているほか、画像検索機能なども提供する。
EmbodyMeでは2020年にxpression cameraの開発をスタートし、同年9月にベータ版を公開した。当初からの目的の1つが「ビデオ会議疲れ」を解決することだ。
ビデオ会議ではカメラの前にずっと待機して、同じ画面を見続けなければならない。なおかつ自分の顔が画面に表示されていると常に見られていることを意識してしまう。「これらの負担を軽減できる仕組みが作れないか」と考えたことが開発を始める1つのきっかけになった。
技術的には表情を推定する技術(3D Dense Face Tracking)と画像を生成する技術(Neural rendering )が軸だ。5万点以上の3Dのポイントを推定できる仕組みによって細かな表情を認識。その情報をもとに1から画像を生成し、リアルタイムで動かせるようにしている。
実際にベータ版のユーザーにヒアリングした範囲では社内外のカジュアルな会議や友人同士や家族とのコミュニケーションのほか、子どもと遊ぶ用途でも使われていたそう。xpression camera自体はビデオ会議だけでなくYouTubeの動画作成などでも活用できるため、動画クリエイターのユーザーもいたようだ。
また「社内会議でみんながカメラをオフにしているので、コミュニケーションをより円滑にするために使ってみたい」といったように、複数の企業からも問い合わせがあったという。
今回リリースした正式版ではMacに加えて新たにWindowsにも対応。AIのコアエンジンを一新して動きをよりシャープに改善し、バーチャル背景などの新機能も加えた。有料プランではクリエイターの利用も見越して録画機能も取り入れている。

EmbodyMeは2021年にFreakOut Shinsei Fund、DEEPCORE、キャナルベンチャーズ、山口キャピタルから1.5億円の資金調達を実施し、開発体制の強化も進めてきた。
今後はカメラの前にいなくても音声だけで表情を推定し動かせるようになる機能や、ボタン1つで色々なアクションができる機能などをしていく方針。企業向けのエンタープライズプランも計画しているという。
「『対面に比べてコミュニケーションがしづらいこと』がビデオ会議における課題であり、それを解決していくことが大きな目的です。必ずしも現実と同じようなコミュニケーションを目指すのではなく、(xpression cameraのようなかたちで)対面ではできないような感情表現を行うことで、対面を超えるコミュニケーションを実現していきたいと思っています」(EmbodyMeで代表取締役を務める吉田一星氏)
直近ではウクライナのゼレンスキー大統領のディープフェイク動画が大きな問題になったが、xpression cameraのようなサービスも精度が高くなれば悪意のあるユーザーによって悪用されてしまう可能性が出てくるかもしれない。
EmbodyMeとしてはアカウント登録を必須にしてユーザーの行動を把握できるようにするほか、電子透かしの技術などを用いて対策をしていくという。