2023年7月28日(金)、NVIDIAは日本国内における生成AIの開発・活用動向を展望するイベント「NVIDIA 生成AI Day 2023 Summer」を開催した。

日本のAI研究開発をけん引する松尾 豊東京大学教授を基調講演に迎えた同イベントでは、クリエイティブ業界を含む様々な業界における生成AI活用事例が紹介された。そこで本稿では、同イベントで発表されたクリエイティブ生成AIの研究動向と活用事例をまとめる。

なお、本稿で参照したセッション動画は、同イベントページから視聴することができる(視聴にはユーザー登録が必要)。

記事の目次

    イベント概要

    NVIDIA 生成 AI Day 2023 Summer

    日時:7月28日(金)10:00〜18:10
    会場:オンライン/無料(事前登録制)
    主催:エヌビディア合同会社
    https://x.gd/ai_day_23summer

    クリエイティブに進化するStable Diffusion

    画像生成AIのStable Diffusionを開発・提供するStability AIの日本法人代表Jerry Chi/ジェリー・チー氏は、「Stable Diffusionの活用法や事例」と題して、同AIの最新機能と活用事例を発表した。

    2022年はDALL-E 2、Midjourney、そしてStable Diffusionが公開され、まさに「画像生成AI元年」となった。チー氏によると、画像生成AIのなかでもオープンソースで公開されたStable Diffusionは、以下のGoogleトレンドを使って作成した検索ボリュームの推移を示した画像からわかるように、同AIが発表された2022年8月末以降、DALL-E 2などよりも大きな注目を集めてきたという。

    2023年7月28日(金)には、Stable Diffusion XL 1.0がリリース。同AIはStability AIのフラッグシップ画像モデルであり、プロフェッショナルの要求に応えられる品質と機能をもつ。そうした機能には任意の画像のアスペクトを変更すると同時に、拡大された部分の画像を補完生成するUncropがある。

    Clipdrop launches Uncrop

    Reimagineは、任意の入力画像を与えるとプロンプトの指定なしで入力画像のバリエーションを生成する機能だ。例えばファッションスケッチ画像を入力すると、ポーズの異なる画像が生成される。

    Clipdrop launches Reimagine XL

    Stable Doodleは、簡単なスケッチから高精細な画像を生成する機能。この機能を使えば、簡単な椅子のスケッチから様々なデザインの椅子画像が生成できる。同機能は、多くのクリエイティブ業務の効率化に役立つだろう。

    Clipdrop Launches Stable Doodle

    Stable Diffusionはオープンソースであるため、ソースコードが完全公開されている。それゆえ、Stability AIの関係者でなくても同AIの新たな画像生成機能を研究開発できる。

    そうした研究の成果には、自然言語で画像の編集内容を指示できるInstructPix2Pixがある。この機能は例えばエッフェル塔の画像に対して「空に花火を加えて」とプロンプトで指示すると、指示通りに画像を編集するというものだ。2023710日(月)には、任意の画像を与えるとその画像に基づいた簡単なアニメーションを生成するAnimateDiffが発表された。

    ▲InstructPix2Pixの活用例

    広告制作やプロダクトデザインにも活用

    チー氏のセッションでは、Stable Diffusionの様々なビジネス活用例も紹介された。KDDI202337日(火)に立ち上げたメタバース・Web3サービスプラットフォーム「αU(アルファユー)」コンセプト動画には、アニメの補間部分の生成にStable Diffusionが使われている。

    αU 「もう、ひとつの世界。」

    アメリカの映像制作スタジオCorridor Digital20232月に発表した短編アニメ「ANIME ROCK, PAPER, SCISSORS」では、人間の俳優が演じる実写動画をStable Diffusionに入力して、アニメ調の人物を出力するという技法が使われている。

    VFX Reveal Before & After - Anime Rock, Paper, Scissors

    Netflixアニメ・クリエイターズ・ベースが2023年1月に発表した短編アニメ「犬と少年」では、背景の制作にStable Diffusionが活用されている。同アニメの制作に参加したアニメーション監督の牧原亮太郎氏は、「ツールと手描きの手法を組み合わせることで、人間にしかできないことに集中し、その結果、表現の幅を広げられることを実感しました」と発言している。

    アニメ・クリエイターズ・ベース アニメ「犬と少年」本編映像 - Netflix

    完全自動運転EVの量産を目指すAIスタートアップのチューリング2023315日(水)、カーデザインのプロセスにおいてStable Diffusionを活用したことを発表した。

    その活用法とは、カーデザインに関連する複数のキーワードを同AIに入力して大量の画像を生成後、それらの画像を分類した上でさらにプロンプト入力と画像生成をくり返して、最終的なカーデザイン画像を確定するというものだ。

    Turingコンセプトカー

    以上のようなセッションの最後に、チー氏はStable Diffusionをはじめとした画像生成AIが今後数年間で社会に及ぼす影響について述べた。そうした影響には小説家自身が漫画を描けるようになるといった「できる」タスクの増加、キュレーター・プロデューサーとしてのスキルがより重要になることなどが挙げられた。

    りんな、NVISIA Picasso、感情認識AIも発表

    NVIDIA生成AI Day 2023 Summerでは、Stability AI以外にもクリエイティブAIを発表した企業があった。AI「りんな」を開発提供するrinna株式会社は、「日本語事前学習モデルの公開とAIキャラクターの作成事例」と題して、りんなに活用されているAIについて発表した。

    Stable Diffusionをはじめとする生成AIは海外で開発されたため、日本語で使うのが難しかったり、出力に海外文化のバイアスが含まれていたりする問題がある。同社は生成AIを日本向けに再開発する活動を続けており、そうした活動の成果としてJapanese Stable Diffusionがある。このAIを使うと、例えば「サラリーマン 油絵」というプロンプトを入力すると、日本人が期待するような画像が生成されるのだ。

    以上のような生成AI開発の成果を生かして、rinna社はAIキャラクターを育成できるスマホアプリ「キャラる」、テキスト入力すると感情表現を伴った合成音声とフェイスモーションを生成するツール「Koemotion」、そして「AITuber りんな」を発表している。

    【切り抜き】AIりんな&織田信長が生配信で全力回答【りんなの部屋】

    今回のイベントを主催するNVIDIAは、「生成AI革命を牽引するNVIDIAのプラットフォーム」と題して、同社の生成AIに関する取り組みを発表し、ビジュアルデザイン向けに開発された生成AIプラットフォーム「NVIDIA Picasso」が紹介された。

    同プラットフォームを活用すれば、テキストから画像、動画、そして3Dオブジェクトを生成することができる。同プラットフォームはユーザー企業が管理する生成AIやデータセットを統合できる上、NVIDIAが開発した生成AIEdify Generative AI」も利用可能だ。

    NVIDIA Picasso, a Cloud-Based Generative AI Service for Creating Images, Videos, and 3D Applications

    国立研究開発法人 産業技術総合研究所「産業技術総合研究所のAIへの取り組み」と題して、同研究所のAIに関する研究成果を発表し、音声から発話者の感情を分析するAIを紹介した。

    この感情分析AIは、言葉を認識するAIと音声を認識するAIを統合することで実現。同研究所が運営するWebサイト「産総研マガジン」に掲載された感情分析AIを解説した記事によれば、このAIはユーザの感情と同期するVRアバター開発への応用が期待されている。

    NVIDIA生成AI Day 2023 Summerでは、クリエイティブ生成AIのほかにもChatGPTをはじめとする大規模言語モデルのビジネス活用に関するセッションも行われた。同イベントは、現在がまさに「生成AI時代」となったことで開催されたと言える。こうした時代において、クリエイティブ業界は生成AIから大きな恩恵を受ける業界のひとつになることだろう。

    TEXT_吉本幸記 / Kouki Yoshimoto
    EDIT_小村仁美 / Hitomi Komura