日本最大のコンテンツビジネス総合展である、「コンテンツ東京 2023」が6月28日(水)から30日(金)にかけて東京ビッグサイトにて開催された。本稿では、6月28日(水)に開催された講演「ジェネレーティブAIで変わるコンテンツ制作とクリエイティブ」の内容を紹介する。

記事の目次

    識者たちが語る生成AIの印象

    今年に入ってから生成AIの分野が急速に注目を集めている。テキスト生成AIにおいてChatGPTが大きな話題になったほか、画像生成AIとしてMidjourneyやStable Diffusionなどが驚異的なイラストの生成能力を見せつけている。

    SNSで多くのユーザーが生成した膨大なイラストやテキストがシェアされたことなども手伝い、生成AIは企業から個人まですさまじい速さで知れ渡ることとなった。しかし今後のクリエイティブに影響を与えることが必至と見られる一方、問題もある。

    例えば、生成AIが深層学習にインターネット上の成果物を参照しているゆえか、生成した画像の著作権侵害の可能性などが指摘されている。すでに幾人かのクリエイターも、自分の作品を生成AIへの深層学習に利用することを禁止することを明言している。また、シンプルにライターやイラストレーターといった職種が生成AIに仕事を奪われるのではないかという危惧も語られがちだ。

    果たして、生成AIがもたらす今後のクリエイティブの可能性や、法的な問題なども含む適切な環境整備も含めた今後はどうなるのか? そんなテーマに対して開催されたのが本講演「ジェネレーティブAIで変わるコンテンツ制作とクリエイティブ」だ。

    登壇者には株式会社noteのCXOである深津貴之氏が参加したほか、実際にStable Diffusionを運用する企業Stability AI Japanの代表を務めるJerry Chi/ジェリー・チー氏が加わった。カンファレンスはnoteプロデューサーの徳力基彦氏が司会を務めるかたちで、生成AIとクリエイティブについて議論された。

    ▲ジェリー・チー氏(中央)

    まず、深津氏は現在のように生成AIが話題になる1年前、2022年の半ばごろからいくつかのサービスに触れていたという。「これは産業革命の蒸気機関が出てきたときや、スマートフォンが出てきたときのようなものになりそうだ」というほどの衝撃を、その段階でも感じていたそうだ。

    ジェリー・チー氏も生成AIの様々なモデルに触れ、改造してみたりするなかで「クリエイティブな可能性が爆発的に増えていく」ということを強く感じていたとのことだ。しかし「2年弱で進化するとは思わなかった」とこの分野の急激な拡大に驚いている様子だった。

    大規模言語AIの構造

    続いてのトークテーマには生成AIの具体的な構造が挙げられた。まずChatGPTなど、大規模言語AIがどのようなしくみでできているかが深津氏によって解説された。

    大規模言語AIのモデルとはシンプルに言えばこうだ。インターネット上のテキストファイルをベースに、AIに様々な会話のテキストデータを学ばせていく。AIはそれらデータの学習結果を基に「手前の文章に対し、こう続きそうだと思われる文章を確率的に返していくもの」という簡潔な出力をしているだけだという。

    にもかかわらず、「数多くのデータを学習させることで、論理的なものができてしまう」ことが大きなポイントだと深津氏は指摘している。

    深津氏は大規模言語AIの新しさとして、一言で「人間の言葉で命令できること」を挙げた。これまでAIとはエンジニアが扱う専門的な分野だったが、ChatGPTのように普通の言葉でAIに指示ができることで世界中の人間が簡単にAIを使えるようになったことが、現状の急速な浸透の一因であるという。

    ▲深津貴之氏(中央)

    ただ、深津氏はChatGPTはテキストのみを生成するAIということではなく、これからの人間とAIの関わり方がもっと容易になることで、様々な可能性が広がることについて言及。大規模言語AIのようにユーザーが普通の言葉でAIを使えるようになった利点として、深津氏は「いろいろなことがひとつのモデルでできること」と「コンテンツを作成できること」があると語った。

    つまるところ、人間がコンピュータと会話できるようになったことがクリエイティブにとって大きいという。これから先ソフトウェアとのやり取りを言葉でできることで、例えば自宅内のカメラでのペットの監視や、ネットショッピングでの商品の購入など、ユーザーが人間の言葉でそれらの機器に指示できるようになる可能性があるという。

    深津氏は「ChatGPTは入口であり、自分たちの業務を自分たちの言葉でマシンに命令できるのが大きい」とまとめている。

    これまではロボットやカメラなど、1つの仕事をさせるのに1つの専門AIが必要だったが、これからは1つのアプリケーションで複数の仕事ができるのではないか、と深津氏は可能性を語った。

    AIに言葉を通じていくつかの仕事をまとめて指示することができれば、例えば株をチェックし、購入して税理士にも連絡するというアクションをひとつのアプリケーションでできるといったものが増えていくのではないか、という未来もありえるとのことだ。

    続いて、AIに言葉を使って「コンテンツを作成できる」とはどういうことかを深津氏は説明。大規模言語AIに人間の言葉を通すことで、小説やレポートを作成するイメージがあるが、深津氏はこのことをさらに掘り下げて「文章でできることは何でもできるようになる」と指摘する。

    例えば音楽の楽譜や、ゲームのマップなども文章の情報として作成できるようになるという。コンテンツを創作するプロセスも企画から試作、PRまでもAIによって可能ではないか、という展望まで語られた。実際、チー氏もすでにブレインストーミングに大規模言語AIを取り入れているそうだ。

    「クリエイティブの全工程で、言葉でできる仕事は全部できる。あらゆるところに可能性が見つかる」と深津氏は大規模言語AIをベースとした今後について語った。この考えをさらに推し進めると、ロボットの操縦も、テキストによる命令書をAIに生成してもらうことで可能になるのではないかという。

    画像生成AIの膨大な可能性

    続いてチー氏が画像生成AIについての現状と展望について解説した。

    改めて解説すると、画像生成AIとは、いくつかの単語を入力することでAI側がその情報から画像を生成するものだ。Jチー氏は主に自社が運営するStable Diffusionの機能を説明するかたちで、講演を進めた。

    例えば「実在しない赤ちゃんがスカイダイビングする」という極端な画像を生み出すこともできる。チー氏は「使い方で想像力がはっきり出るもの」とまず説明する。

    画像生成AIは多くのユーザーが利用し、SNS上で活発にシェアされている。しかし、画像生成AIが流行した初期には人物の画像で指がくっついた奇妙なものが少なくなく見られた。いわゆるグリッチと呼ばれる現象だが、チー氏によれば最近はAIの洗練が進み、指がグリッチする現象も少なくなっているという。

    Stable Diffusionは画像を切り抜いて別の画像と組み合わせた画像を作成できたり、 “バリエーション生成”と呼ばれる、様々な画像のバリエーションから好きなものを選べたりといった、多様な機能をもっている。

    また、Stable Diffusionを改造することで、自然言語で画像を編集できるようにするなど、ツールとしてのブラッシュアップも進めているのだそうだ。

    その他にも様々な手法で画像をコントロールできるようにしている。線画や人間のポーズなどの画像を出力したりコントロールできるほか、操作もマウスドラッグだけで画像編集まで可能。チー氏によれば「直感的に子どもでも画像をいじれるように」というスタンスが、こうした仕様になっているようだ。

    さらにコンテンツを作成するのにも役立つ。ホームページやアプリもStable Diffusionで生成可能で、また様々な製品の写真も作成できるのだという。

    Stable Diffusionのさらなる利用の例には、アニメ制作も挙げられた。Netflixで試験的に制作されたアニメ『犬と少年』は、主に背景の制作にAIが活用された事例だ。これはアニメ制作において省力化できる部分にAIを試験的に導入し、重要な部分のみ人間が制作するというねらいがある。

    アニメ・クリエイターズ・ベース アニメ「犬と少年」本編映像 - Netflix

    他の業界のAI利用例にはゲーム業界も挙げられる。例えばゲーム作成オンラインプラットフォームであるRobloxが生成AI機能を追加しているほか、ゲーム開発の分野でもアイテムの画像などのアセット制作に生成AIが利用されているという。

    これらの機能追加や活用事例が出てきたのがこの1年の動きとチー氏はまとめた。生成AIの分野が拡大するスピードはあまりに早く、チー氏をして「新しい技術が次々と出てきます。講演の直近の2週間でもいろいろ出てくるほど」と語った。

    AI活用による、著作権や倫理にまつわる問題はどうなる?

    このように大規模言語AIや画像生成AIの可能性について語られてきたが、やはり避けられないのはAIによるクリエイティブの著作権や倫理的な問題だろう。

    AIによる成果物の倫理的問題はかねてから取り沙汰されてきた。インターネット上の情報をリファレンスしている以上、いわゆる人種やジェンダーアイデンティティにまつわる偏見などもそのまま反映されてしまう問題が起きていた。

    現在は、各社ともそうした問題に対応しているながれである。深津氏は「いちばん大きいのはいわゆるバイアス」と指摘する。「インターネット上の情報を集めて確率の上で話すだけなので、今のAIはネット上の偏見や誤解もずっと勉強している」と現状を説明した。

    AIは統計マシンでもあるので、例えば男女の職業の話をAIにした場合、男女平等の結果が出てくるわけではない。主にChatGPTを検索の代わりに使っているユーザーも多いというが、深津氏は「その結果にも偏見がないか常にファクトチェックして使うべき」と語った。

    またチー氏はStable Diffusionを運営する企業側らしい問題を指摘。生成AIでよくある問題として「社外秘のように外に出してはいけない情報を入力していないかどうかなど、それを理解して使わなくてはいけない」とも述べた。

    話題は著作権の問題に移った。チー氏は「AI生成物の著作権については、日本政府も明確にしようとしている」と指摘する。実際に文化省が「AIと著作権の関係等について」という資料を公開。まとめれば「著作物はAIモデルの訓練に使用してもいいが、著作者の利益を不当に脅かしてはならない」というガイドラインである。

    しかし法的には安全でも、ファンコミュニティの感情的な問題もあるため、AI利用に関するSNSの批判も全てが聞きいれられるかはわからない。

    深津氏は「すごく難しい。みんなが想定してないトラブルがまだまだある」と語った。「システムでも法律でも完璧にするのは無理。リリースする作り手側が考えるべき」とこれからの問題について提言する。

    チー氏も「いろんな会社が初めて生成AIを使ってみても、トラブルを恐れて取り下げたりする」と現状を語る。ただ、「いろいろやればノウハウが増えていく」とも語り、業界がまだ生成AIに関する経験値が足りていないことも指摘した。

    深津氏は生成AIにまつわるこうした現状を一言で「過渡期のトラブル」という。いまは悪い問題を起こす人間もAI関連に参入しているが、やがてそうした問題は落ち着くのではないかと語った。

    例えば世間に初めてカメラやコピー機が広まったとき、お札をコピーしたりして偽札をつくるような問題があったかもしれないが、もう現代でそんなことをする人間はほぼいない。深津氏は生成AIもそうした悪用をする人間は徐々にいなくなっていくと考えているようだ。

    このトークテーマのまとめとして、深津氏が運営するnoteについても話題が及んだ。現在はnoteもAIアシスタントを導入するなど、積極的に技術を組み込んでいる。この施策に対して深津氏は「noteの場合は著作権というか、クリエイター側が『物をつくらなくてもいいんじゃないか?』と思わせてはダメなんです。創作をアシストするためにAIアシスタントをやっています」と説明した。

    これからクリエイティブ業界に起こる本当の変化とは?

    最後に「生成AIによって、クリエイティブ業界に起きる本当の変化とは何か?」というテーマについて議論された。

    深津氏は「生成AIによって成果物がハイクオリティになる」という。それゆえに「みんながハイクオリティにならなくちゃいけない」とも語った。つまりクリエイティブは参入するクリエイターの土台が大きいほどクオリティが高くなるため、「生成AIによってクリエイターが50億人になったり、異常なほどの土台ができる。だから頂上も大きくなる」というわけだ。

    深津氏は生成AIによるクリエイティブの拡大の例として、「アニメーション監督の新海 誠氏がこれから100万人出てくるようなもの」とも語る。新海氏はキャリアの初期、デジタル制作の恩恵によって『ほしのこえ』をほぼ1人で制作したことが有名である。それと同じように、生成AIを利用して、クリエイターが1人でハイクオリティな作品を生み出す可能性を深津氏は示唆した。

    そして膨大な数になったコンテンツを人間は消費できないため、クリエイティブの頂上にある10%だけが見られ、残りは切り捨てられるのではないかとも語った。

    一方でチー氏は「キュレーションが重要になる」と指摘する。生成AIを組み込むクリエイティブでハイクオリティなものが多量に生み出される世界では、お客さんに最終的にどれを届けたいか、というキュレーターやプロデューサーとしての目線も大事になるそうだ。

    やはり最終的には人間の手によるものも大きく、深津氏は「人間がやった方がいいことと、AIがやった方がいいことはここ数年で厳しく求められるでしょう」と指摘し、講演をまとめた。

    TEXT&PHOTO_葛西 祝 / Hajime Kasai
    EDIT_小村仁美 / Hitomi Komura(CGWORLD)