
AI技術を使い、画像や動画に登場する人物の顔を別人のものと差し替える、フェイクコンテンツの「ディープフェイク」。2019年にはFacebook・CEOのマーク・ザッカーバーグ氏が「1人の男が数十億人から盗んだデータを支配することを想像してください」と発言しているかのように見せたディープフェイク動画が話題となった。
エンターテインメントなどの領域で利用が期待されていたが、現状は悪用で注目を集めるケースが増えている。日本でも2020年、女性芸能人がアダルトビデオに出演しているかのように見せかけるディープフェイク動画を作成した元大学生の男が逮捕された。2021年9月には判決公判が東京地裁であり、楡井英夫裁判長は男に対し、懲役2年(執行猶予3年)、罰金100万円の有罪判決を言い渡した。
もちろん、エンターテインメント目的の利用も進んでいる。最近ではディープフェイクを活用した顔交換アプリ「Reface」を使って、自分の顔と著名人の顔を入れ替えた動画を作り、SNSに投稿して楽しむユーザーも増えてきた。
My long lost audition for Lord of the Rings. I thought I nailed it. You decide. pic.twitter.com/4ITEpLK0gD
— Bruce Campbell (@GroovyBruce) May 31, 2021
ディープフェイクの悪用の実態やその対策、そして今後の有効活用やさらなる可能性について、AIを活用した“フェイク映像“カメラアプリ「xpression camera」などを展開するEmbodyMeの代表取締役・吉田一星氏に聞いた。
──ディープフェイクとはどのような技術を活用した、どのようなコンテンツを指すのでしょうか。
ディープフェイクとは、狭義では、AIを使って動画の中の人の顔を別の人の顔に入れ替えたフェイク動画のことを言います。しかし、ディープフェイクという言葉が広まるにつれて、AIで生成された動画や画像、音声などのメディア全般のことを指すようになりました。
ディープフェイクという言葉にはどうしてもネガティブなイメージがつきまとうため、最近では「シンセティックメディア」や「合成メディア」などとも呼ぶようになってきました。
画像改変によるフェイクコンテンツは100年以上も前から問題になっていましたし、PhotoShopなどの画像編集ソフトの普及により、今までも多くの「フェイク画像」が生み出されてきました。一方で、「フェイク動画」の作成は近年までは難易度が高いものでした。
しかし、ディープラーニングの技術が発展し、フェイク動画が簡単に作れるようになったことで、ディープフェイクというムーブメントが起こりました。
──代表的なディープフェイクコンテンツとは。
ディープフェイクコンテンツの多くはポルノ動画です。2019年10月の時点でディープフェイクコンテンツの96%をポルノ動画が占めているというデータもあります。
一方で、精巧に作られた有名人や政治家のディープフェイク動画はたびたびSNS上で話題になり、技術の悪用への警鐘とともにメディアに多く取り上げられてきました。
2018年には映画監督のジョーダン・ピールと彼の映像制作会社が作成したバラク・オバマ元米国大統領のフェイク動画が話題になり、そのクオリティの高さから今でもディープフェイクの代表例としてメディアに取り上げられることが多いです。
最近では、トム・クルーズのフェイク動画がTikTokなどで拡散され、もはや本物かどうかまったく区別がつかないレベルにまで達していると話題になりました。
トム・クルーズの動画については、どうやって作ったかのネタばらし記事と動画も後日公開されて注目を集めました。
ディープフェイクの専門家と、トム・クルーズのモノマネの第一人者がタッグを組み、AIモデルの学習に2カ月、動画の撮影に数日をかけ、撮影後、それぞれの30秒ほどの動画の編集にも24時間ほどかかったといいます。
技術は年々進歩しているとは言え、本物と区別がつかないクオリティの動画を作るには、まだまだスキルと手間がかかるのが現状です。
──ディープフェイクはどのように有効活用されていますか。最近のトレンドや技術の進歩について教えて下さい。
ディープフェイクは、コロナ禍で必要不可欠になったビデオチャットやライブ配信などのビデオコミュニケーションを変えていくかもしれません。
EmbodyMeがリリースしたxpression cameraは、ZoomやGoogle Meet、YouTubeなどで、自分の外見をディープフェイクで置き換えて、表情や体の動きに応じてリアルタイムにコミュニケーションができるアプリです。対面に比べたコミュニケーションのとりづらさや、Zoom疲れなどの問題を解決します。
NVIDIAも同様に、ディープフェイクを活用してビデオコミュニケーションを変える取り組みをしています。
また、ディープフェイクはエンターテイメントの世界でたびたび注目を集めています。Refaceや「ZAO」などの顔交換アプリや、「Deepfacelab」などのオープンソースプログラムを使って、有名人の動画の顔を自分の顔などに入れ替えた動画はSNS上でたびたび拡散されています。
ディープフェイクはアートの世界も変えようとしています。今年、人工知能を研究する非営利団体のOpenAIは、「DALL-E」という、文章を入力すると画像を生成する技術を発表しました。
「チュチュスカートを履いた赤ちゃん大根が犬と散歩をしている」など、突飛な文章を入力しても、ちゃんと文章に沿ったような画像を生成してくれるのは驚きです。

DALL-Eはまだオープンソースとしては公開されていないのですが、すでにオープンソースとして公開されているOpenAIの「CLIP」という技術と、画像生成技術である「VQGAN」を組み合わせて、文章から生成したアートがSNS上で流行しています。ディープフェイクはアートやデザインのあり方も変えていくのかもしれません。
──ディープフェイク技術を悪用した問題も起こっています。どのようなケースがあるのか教えてください。
ポルノ動画はディープフェイクコンテンツの多くを占めますが、有名人の顔に入れ替えたポルノ動画を公開することは名誉毀損、著作権法違反にあたる犯罪であり、日本でも逮捕者が出ています。
もともとディープフェイクがこれほど話題になった一番最初のきっかけは、あるネットユーザーが掲示板サイトのRedditに有名人の顔に入れ替えたポルノ動画を投稿して、大きな話題になったことです。そのユーザーが使っていたハンドルネームである「deepfakes」が、ディープフェイクという言葉の由来のひとつともなっています。
彼がポルノ動画を作成するのに使ったAIのプログラムは、オープンソースとして公開され、それを使って多くの人が動画を作成したことがディープフェイクの大きなムーブメントへとつながりました。
フェイク画像の作成は前述のとおり、ディープフェイクの登場以前より問題になっていました。1990年代にはPhotoShopなどの画像編集ソフトとインターネットの普及によって、有名人の顔に入れ替えたポルノ画像であるアイコラ(アイドルコラージュの略称)が出回るようになり、逮捕者も出ています。
また2021年には米国では、チアリーディングチームに所属する娘の母親がほかのメンバーを追い出すため、ディープフェイクを使ってそのメンバーのわいせつなフェイク画像や動画を作成したとして逮捕されたという事件もありました。
ディープフェイクはポルノのほかにも、フェイクニュースや詐欺、自白証拠の捏造など、さまざまな犯罪での利用が懸念されています。
実在しない人物の画像を簡単に生成できるツールを使って、SNSで偽のプロフィール画像を作り、架空の人物を装うような詐欺は多く行われているようです。
例えば、何者かがFacebook上でオリバー・テイラーという実在しない人物を作り出し、イギリスの法学者とその妻をテロリストとして誹謗中傷する活動を行っていたということが確認されています。
しかし動画となると、ポルノ以外ではほとんど使われておらず、2020年の米大統領選でもディープフェイクによる大きな影響は確認されておりません。
理由としては、前述のトム・クルーズの動画のように、本物と区別がつかないクオリティの動画を作るのは難しいためです。メディアで話題になっているような有名人のフェイク動画は、SNSで拡散する目的で専門家が時間と手間をかけて作っているのが現状です。
──どのような対策がとられていますか。またどのような対策が必要でしょうか。
ディープフェイクのムーブメントが拡大するとともに、ディープフェイクを検出する技術も多く研究されるようになり、国や大手企業、スタートアップなどがさまざまな取り組みや支援を行っています。
DARPA(米国国防高等研究計画局)では、ディープフェイク検出技術のプロジェクトに資金を提供するなどの支援を行い、2018年11月の時点ですでに6800万ドル(約74億円)の資金を投入しています。
Microsoftは昨年の大統領選前に、「Microsoft Video Authenticator」というディープフェイクの検出ツールを発表しました。

多くのスタートアップも、ディープフェイクを検出する技術に取り組んでいます。例えば、Deepwareはウェブ、アプリ、APIで簡単に使えるディープフェイク検出ツールを公開しています。
また、Facebook、Microsoft、Amazonなどは2019年、Deepfake Detection Challengeというディープフェイク検出技術のコンテストを行い、2114チームが参加しました。
しかしながら結果はトップチームが識別できた精度は65%で、ディープフェイク検出技術の難しさも浮き彫りになりました。
ですが、ディープフェイクを作る段階で、コンテンツに何かしらの情報を埋め込めれば、容易に検出が可能となります。EmbodyMeでは、電子透かしと呼ばれる技術を開発していて、人の目に見えず機械のみが検知できる情報を、我々のプロダクトで作成されたすべての動画に埋め込もうとしています。
人の目に見えないだけでなく、消すのが困難で、カメラで撮影するなどアナログな手段でコピーしても残るので、悪用を抑止することができます。
──今後ディープフェイクはどのように活用されていくと思いますか。
ディープフェイクは、とても幅広い分野での活用が期待されていますが、その中でも将来的に世の中を大きく変える可能性がある分野は「映像制作」と「バーチャルヒューマン」だと考えています。

映像制作にディープフェイクを活用することで、将来的には、撮影をしなくても、誰もが家にいながらハイクオリティな映画やテレビ番組が作れるようになります。
編集ソフト上でタレントや役者を選ぶだけで、自由自在にセリフを喋らせたり、どんな動きもさせることができるので、映画監督やテレビ番組制作者が思い描いた通りの世界観をとても簡単に実現できます。
例えば、もう亡くなった俳優と、現実には存在しない「バーチャルヒューマン」、現実に生きているタレントが共演するようなテレビ番組も可能となります。
バーチャルヒューマンはディープフェイクと組み合わせることで、世の中を大きく変える可能性を秘めています。VTuberは現状、2次元のキャラクターがほとんどですが、ディープフェイクと組み合わせることで実在する人間も活用できるようになります。
実在するタレントを、ある意味キャラクターのようなIPと同じように扱い、永遠に若いままの姿で、死後も活用することが、技術的には可能となります。タレント自身の能力に関わらず、さまざまな言語をしゃべらせることもできるようになります。
タレントというIPを、時空や能力の制約を超えて活用できるようになれば、人気タレントはコマース、ニュース、ゲームといったあらゆるサービスやビジネスで活用されるようになるのではないでしょうか。タレントが中心となり、そこにあらゆるビジネスが依存する構造に社会が変わっていくかもしれません。
SNSの普及によってすでに大きな力を持つインフルエンサーは今後、バーチャル化することで、時空や能力の制約を超えさらなる影響力を持つようになるのではないかと予想しています。