
- 2度のサービス開発を経てたどり着いた「AIピカソ」
- 今後は有料課金モデルの導入も検討
- ベンチマークはAI写真加工アプリの「FaceApp」、今後はさまざまな分野への応用も視野に
公開後、瞬く間に大きな話題を呼び、画像生成AIブームの立役者となった「Stable Diffusion」。テキストを与えるとその指示通りの画像を生成するこのAIは、英国のAIスタートアップ・Stability AIが開発した。その公開時には、Stable Diffusionのコードやドキュメントをオープンソースとして提供したことも話題を集めた。
8月23日のStable Diffusionの公開から間もない8月31日、その公開された画像生成モデルを活用して開発された画像生成アプリ「AIピカソ」がリリースされた。開発したのは筑波大学発のベンチャー企業・AIdeaLabだ。代表の冨平準喜氏によるアプリリリースのツイートは、約7000件のリツイート・1.7万件のいいねが付くほどの反響を呼んだ。
AIdeaLabに続くように、9月9日には女子高生AIりんななどを運営するrinnaがStable Diffusionを日本語に特化させた「Japanese Stable Diffusion」を開発したことを発表するなど、Stable Diffusionの画像生成モデルを活用したサービス開発が相次いでいる。
AIピカソは端的に言えば、Stable Diffusionの日本語版。画像のイメージを単語や文章で入力すれば、AIがそれをもとに自動で画像を生成してくれる。また、スケッチ画像やラフ画などをアップロードすると、その構図と同じ画像が生成されるといった特徴を持つ。現在はiOS版のみの提供となっており、Android版は後日提供予定だという。なお、AIピカソを通じて生成した画像の著作権に関しては、Stable Diffusionの利用規約に準じるとのこと。
驚きのスピードでAIピカソを開発・提供したAIdeaLabとは、どのような会社なのか。またAIピカソの開発経緯とは。代表取締役の冨平氏に話を聞いた。
2度のサービス開発を経てたどり着いた「AIピカソ」
──AIdeaLabはどのような経緯で設立された会社でしょうか。
AIdeaLabは、筑波大学でディープラーニングを研究していたメンバーたちで創業した大学発ベンチャーです。会社の設立からは1年8カ月ほど経ちます。画像分野や音声分野などのAIの研究開発に強みを持っており、研究論文で発表されるも実用化に至っていないような技術をプロダクトに落とし込み、開発しています。
今までに複数のプロダクトを発表しました。ひとつが、AIによる音声認識技術を活用した自動文字起こしサービス「AI議事録取れる君」。もうひとつがイベントをオンライン配信する画面に視聴者のコメントを流すことができるサービス「CommentScreen」です。
CommentScreenは、マイクロソフトやサイバーエージェントといった企業で導入されており、累計のユーザー数は100万人を超えています。直近はディープラーニング技術を使った日本語のフォント生成システムを開発し、特許を出願しました。
他にも公開していないプロトタイプのプロダクトがたくさんあります。「世界中の人をあっと驚かすプロダクトを生み出す」というビジョンを掲げ、AI研究のバックグラウンドを生かすかたちでプロダクトを開発しています。
──AIピカソの開発に至った経緯を教えてください。
私たちはAIの研究・開発者として、画像生成技術の進歩を誰よりも近い位置で観測し、その可能性を感じていました。実は新規プロダクトのアイデアとして、1年ほど前から何度も画像生成技術を活用したアプリケーションの開発について検討していたんです。しかし、当時の画像生成技術の精度ではプロダクトとして提供するのに限界があったこと、自社でモデルを構築した場合はディープラーニングによる学習に多くのリソースを費やすことになるといった理由から、開発を見送っていました。
今回、AIピカソの開発のきっかけになったのは、Stable Diffusionのモデルがオープンソースで提供されたことでした。これにより、先に検討していたようなアプリケーションを開発できると思い至り、すぐに開発に着手しました。

今後は有料課金モデルの導入も検討
──リリース後の手応えはいかがですか。
私たちはこれまでも、画像生成AIを活用したtoC向けのアプリケーションを2つリリースしてきました。ひとつはZoom上で映る自分の顔にメイクをしているような加工ができるアプリ「beauty zoom」、もうひとつは顔写真をアップロードして浮世絵風やディズニー風といった加工ができるアプリ「OhMyFace」です。この2つのプロダクトはなかなかユーザーが増えませんでしたが、AIピカソのリリースが3度目の正直ということで、アプリを多くの人に使っていただけて嬉しく思っています。
一方で、アプリを提供するためのサーバーの管理費が大きく発生するようになってきたこともあり、マネタイズについても検討しています。現在は、画像を生成するタイミングで数回に一度、広告が流れるようにしました。今後は月額制の有料課金モデルを導入することで、有料ユーザーは広告を見ずに無制限に画像を生成できるようにします。画像をどんな画風にするか、無制限に選べるような仕組みも提供していく予定です。
──画像生成AIの盛り上がりをどう見ていますか。
2018年に人間の顔写真を高精度で生成可能にした米半導体開発のエヌビディアによる「StyleGAN」、2021年にテキストの指示による汎用的な画像生成を実現した米AI開発・OpenAIの「DALL・E」、2022年にマイクロソフトが発表した画像生成AI「NUWA-Infinity」など、AIによる画像生成の領域でいくつもの革新が起きてきました。
そのような技術革新が基盤となり画像生成AIも実用化のレベルに達し、米AI開発・Midjourneyの「Midjourney」、そしてStability AIによるStable Diffusionやさらに手軽に使える「DreamStudio」のように、多くのユーザーが使えるサービスが誕生しています。
その中でもやはり、Stability AIがStable Diffusionのモデルをオープンソースで公開したことが与える影響は大きいです。画像生成分野のAIの研究開発は加速すると思います。
これから注目すべきは、汎用(はんよう)画像生成AIをプロ仕様にチューニングすることです。例えば、漫画を描くことに特化したり、服をデザインするのをサポートしてくれたりと、各専門領域で活躍するAIが登場するのを期待しています。
ベンチマークはAI写真加工アプリの「FaceApp」、今後はさまざまな分野への応用も視野に
──AIピカソ、AIdeaLabの今後の展開について教えてください。
私たちがベンチマークにしているのは、世界的にヒットしたAI写真加工アプリの「FaceApp」です。FaceAppはiOSとAndroidの累計で5億件以上のダウンロードを記録しています。AIピカソはリリースから2日間で8.5万件ダウンロードされ、日本のApp Storeの無料アプリランキングでは最高で3位になりました。
アプリをリリースしてみてわかったことですが、ユーザーは想像力豊かで、こちらがあっと驚くような画像を作り出してSNSに投稿しています。今後はSNSを活用して、日本だけでなく世界にユーザーを広げていくことを目指します。
また画像生成AIが広まったことで、どういったプロンプト(AIに与える指示文)から画像を生成したかというデータが価値を持つようになりました。私たちはアプリ提供者として、そのデータを蓄積しています。それらを活用して、生成された画像やその生成に使用したプロンプトの共有サービスを展開していくことも検討しています。
また先に挙げた漫画の執筆や服のデザインのように、画像生成AIのモデルのチューニングはさまざまな分野に応用できると考えています。AIを活用できそうな分野の企業と、共同研究も行っていければと思っています。