2021年初頭から現在にかけて、画像生成AIモデルが熱狂的な盛り上がりを見せている。2022年に登場した「Stable Diffusion」はオープンソースかつ商用利用が可能なモデルとして公開されたこともあり、この1年で広く普及した。こうした展開を描いたのが、「AI技術の民主化」を掲げるStability AIだ。

同社は2022年10月、10億ドルの評価額で1 億100万ドルの資金調達を発表。2020年の会社設立から、2年弱でユニコーン企業へと成長した企業である。

今回は日本チームの代表であるジェリー・チー氏に、khaki の横原氏とCGWORLDで共同インタビューを実施。「Stable Diffusion」の今後の展開やStability AIが実現したい世界、加えてAIサービス提供者視点からみる今後のクリエイター像、AI活用のポイントについて掘り下げた。

記事の目次

    interviewee

    Stability AI
    https://ja.stability.ai/

    ジェリー・チー氏

    横原大和氏

    Stability AI日本チームの施策

    CGW:本日はよろしくお願いいたします。まずは自己紹介をお願いいたします。


    ジェリー・チー(以下、ジェリー):Stability AI日本チームを統括しているジェリー・チーと申します。来日して13年で、もともと機械学習を創造力に活かすことに強い興味がありました。昨年頃から画像生成AIが著しく発展してきたことをきっかけに現職となりました。


    横原大和(以下、横原):株式会社khakiの横原です。khakiはCMやMVの制作を中心としたCGプロダクションで、最近では映画作品やVRなどの分野にも携わっています。私自身はジェネラリストとして、モデリングやアニメーション、ディレクションなどに従事しています。


    CGW:まずは、「Stable Diffusion」の概要について教えてください。


    ジェリー:「Stable Diffusion」は、アート、デザイン、エンターテインメントなど、さまざまな用途で高品質な画像を作成するための強力なツールです。拡散モデルとして知られる最先端の生成アルゴリズムを利用しており、自然な質感とディテールを持つ高品質の画像を生成するように設計されています。

    最近ではコカコーラのCM制作や、The ChainsmokersのMVにも活用されているようで、これらの事例は個人的に印象に残っています。

    「Stable Diffusion」活用事例





    CGW:改めて、Stability AI日本チーム立ち上げの理由や規模について教えてください。


    ジェリー:立ち上げの理由は、日本の持つ漫画やアニメなどの文化的土壌の豊かさに着目し、「日本のクリエイターや会社の創造力を拡張したい」という想いがあったからです。これから入社する方を含めると、5,6名の規模になります。
    現在も共に働いてくれる仲間を募集しています。
    (求人情報)https://stability.ai/careers


    横原:Stability AIの目指す世界観、理想について教えてください。


    ジェリー:Stability AI全体として「AI技術の民主化」を目指しています。最終的には10億人が使うような技術として、誰でも、それこそ老若男女使えるようなレベルで提供したいと考えています。


    CGW:オープンソースである理由はなんでしょうか。


    ジェリー:そうですね。では一度「何もオープンでない世界」を想像してみてください。一部の人、例えば豊富な資金を持つ大企業などが人類にとって汎用的に役立つ技術を独占してしまったとしたら、その企業が決める価値観や文化しか世界で使われなくなってしまうかも知れません。これは大多数の市民にとって、あまり良い未来ではないと思っています。AI技術を民主化し、多くの方が気軽に触れられる環境を作り、公平な環境を作ることがStability AIの理想です。
    大切で有益な技術だからこそ、「AI技術の民主化」が必要だと考えています。


    横原:具体的に、日本国内ではどのような活動を行っているのでしょうか。


    ジェリー:地域や、組織ごとにカスタマイズされたモデルの開発、加えてメディア運営、イベント登壇などを通してのコミュニティ形成、認知の拡大を行っています。またアニメ、ゲーム、映画などのコンテンツを制作するような日本のクリエイティブを支える企業との協働も積極的に行っていきたいです。

    特に、様々な企業で弊社のAIサービスが活用されるように進めていきたいと思っています。いわゆるto Bの領域ですね。現状日本では「Stable Diffusion」を、プロダクションレベルで映画や映像作品の中で使用している事例はまだ少ないです。実務での活用を推し進めるため、日本チームとしては日本の言語や文化などをベースにローカライズされた新たなモデルの開発や、個別の企業に対してカスタマイズしたプライベートなAIモデルの提供などを行っていきたいと考えています。


    CGW:プライベートなAIモデルというのは具体的にどういった内容になるのでしょうか。


    ジェリー:アニメ制作会社や出版社、広告代理店などが所有するアセットをデータとしてインポートとし、企業ごとにカスタマイズされた生成サービスを展開するといった内容を考えています。あらゆるドメインに特化した個別のモデルを作ることも可能ですし、場合によっては特定のアニメに特化したモデルを作ることだってできます。

    これとは別に、さまざまな企業と相談しながら、R&Dを一緒に行うといった活動も行っています。数ヶ月前にはできなかったことが今では当たり前にできている、といったことも少なくないので、各社と協業しながらトライアンドエラーを繰り返しています。


    CGW:日本国内のプロジェクトに特化する形で、国内プロダクションとの協業や研究を続けていると。「AI技術の民主化」という意味では、Stability AIの公式Twitterでは「Stable Diffusion」以外の生成AI関連情報も発信していますね。

    これはどういった意図があるのでしょうか。


    ジェリー:それは「生成AIを日本で盛り上げたい」という想いが根幹にあります。日本は英語圏ではないために情報の流通に時間が掛かります。Stability AIが自社の情報に関わらずAI関連情報を翻訳し、分かりやすく発信することでAI業界全体の向上に繋がると考えています。


    AIを仕事に活かすためには

    CGW:AI業界全体をみても、2022年末から現在に掛けて大きく変化していますが、業界全体の動向の印象を教えてください。


    ジェリー:技術の進歩が早く、そして研究に基づいた実装、開発を世界中の誰かが毎日やっている。こうしたサイクルがものすごいスピードで行われている印象です。また、ユーザーにせよ投資家の反応にせよ、それこそTwitterのRT数やGoogleの検索数に到るまで大きく増加傾向にあります。技術の進歩に合わせて、バズの規模がどんどん拡大している印象です。


    横原:ちなみにkhakiでも既にAIをコンセプトアートの資料として使うこともありますし、権利的に問題ないのであればテクスチャなどに使うこともあります。将来的な話になると思いますが、映像コンテンツとして成立するレベルで、AIに完全に任せられるようになるのはいつ頃になると予想していますか?


    ジェリー:未来の予測は難しいですが……。例えば、「Stable Diffusion」も3Dモデルに対応する予定ですが、これによってすぐにモデラーの仕事が必要なくなるというわけではないと思います。
    完全な代替ではなく、あくまで補助的なものに留まると思います。ただし、10年後は今よりはるかに簡単に多様なものを生成できるでしょうね。ただ、最初のうちに出てくるプロダクトは、完全にクリエイティブを任せられるものではないと思います。

    補助的というのは、例えば「今まで背景を消すだけで1時間掛けていた」などの作業をAIで終わらせて、その分の時間をよりクリエイティブなところに使うということです。AIに画像を作ってもらってそれを選ぶ、いわばAIの監督的な仕事も発生するでしょう。同じ仕事時間をどのように使うのかが重要になります。


    横原:経営者や、コンテンツを設計するような立場にいる人はAIの進化をポジティブに捉えているように感じますが、いちアーティストとしては「AIをどう考えれば良いか分からない」といった感覚を持っている人もいるかも知れません。プロのアーティストは、どうやってAIと付き合っていくべきなのでしょうか。


    ジェリー:どのようにAIをうまく自分の仕事に活用していくのかが大切だと思います。例えば背景を描いてきたアーティストは、AIに背景制作の一部を任せ、自身はキャラクターも描けるようにしていくなど、活用の幅を広げる工夫が必要です。とは言っても、自分の思想や手法と、経営者の意思が違うケースもあると思います。だからすぐに変えるのは難しいということも理解しています。

    ただ新しい技術が出てくるということは当然、チームや会社のスタイルもいずれにしろ変わると考えています。
    柔軟に対応していくことが大切だと思います。


    CGW:これまでのお話を踏まえると、つくりたいものを想像しAIをうまく活用することでビジュアルの表現を制作する力が今後は重要になるのではないかと感じています。クリエイターは今後どのようなスキルを養えば良いのでしょうか。


    ジェリー:ディレクション能力とキュレーション能力が重要だと感じます。
    選んで組み合わせるところまでは出来ても、伝えたいことは何か、それが人にどんな印象を与えるのか判断する能力を、AIはあまり持っていません。もちろん、他のテキスト生成AIを組み合わせることでディレクションの根幹部分をある程度置き換えることはできるかも知れませんが、ファンに何を届けたいか、クライアントが何を求めるか、それを判断するのは常に人間です。

    ただ、ディレクションのサポートという意味では、「AIへの聞き方」も一種のスキルにはなるかと思います。


    横原:ここで、あえてAIの進化に対する人々の反応についてもお伺いしたいと思います。日本と諸外国でAIに対する反応の違いはありますか?


    ジェリー:皆さんがAIに対してどんなふうに感じているのか定量的なデータがないのでなんとも言えないところではあるのですが.……、ただAI全般でいうと、日本は英語圏より概念的な部分で抵抗を感じる人が少ないような感覚はあります。
    例えばアメリカ人はAIやロボットと聞くと『ターミネーター』『マトリックス』などロボットが人間の脅威として存在するような世界観の作品を連想する人も多い印象ですが、日本人は『ドラえもん』だったりしますよね。もしかしたらAIに対してのスタンスに、そのようなコンテンツの影響があるのかもしれませんね。


    横原:これまでお話してきたようにAIが業務の補佐として活躍する点には大きな期待を寄せている一方で、「その作業が好き」「有名作品に携わること自体がやり甲斐」というようなクリエイターもいると思います。私たちは皆デジタルツールを使っている以上、ツールの進化による淘汰は当然受け入れています。ただ、あまりに速すぎる(笑)。これが10年スパンであればいいですが、1、2年で起き得る変化量としては大きすぎるというのが本音です。この点に関してはどのように捉えていらっしゃるのでしょうか?


    ジェリー:確かに速すぎますよね(笑)。
    私も最新のニュースを追うだけでも大変だと感じています。おっしゃる通りで単純作業的な工数が減ることで求められる仕事も変わるかもしれません。しかし、もっと表現できることが増えたり、クリエイターが別のより大事だと思える部分に時間をさけるようになることはクリエイターにとって大きな価値になると考えています。

    例として、ゲーム制作のプロジェクトで考えてみましょう。AIを活用し単純作業的な工数を削減することで、まず時間が生まれます。その時間を、これまでしたくてもできなかった、より広大なフィールドをつくることや、より表現したい世界観に沿ったアイテムをつくり込むことなどに充てることができれば、これまでにないクオリティ、ジャンルの表現が生まれるのではないでしょうか。少なくとも多様な表現が創出される可能性は広がるのではないかと考えています。


    CGW:AIの活用を広めていく上で他に課題に感じていることはありますか?


    ジェリー:AIサービスが乱立していることですね。今はどれが正しく機能するのか、目的に対してどれを選べばいいのかがわかりにくい状態だと思います。そもそもAI関連の情報も多すぎてカオスな状況ですよね。現状では、AIサービスを包括的に批評しているサイトなどで情報を精査するのがおすすめです。
    例えば、futuretools  Built with AI AI TOP TOOLSなどがありますね。


    横原:確かにそうですね。私もAIサービスを包括的に批評しているサイトをみて、利用するAIを決めることがあります。

    実際にそのようなサイトをみていて私が感じるのは、AIが活用されているコンテンツのジャンルがかなり偏っていることです。また使用者側にとって著作権問題などが分かりづらいことも気になっています。それらが解決してより多様なジャンルのコンテンツがAIを使って制作されて行けばいいなと思います。


    ジェリー:そうですね。現状はAIで生成されている作品のジャンルに偏りがある印象ですね。AIを現時点で使用している人の動機に多少の偏りがあるのかなと思います。その偏りによってAIで生成できるものの印象が根付いているのかなと。もちろん全く悪いことではないですし、自然な流れだと思います。女性や子供、ご高齢の方などAIに比較的まだ馴染みのない方が好むようなものもつくれることを認知してもらえるように弊社は多様なニーズに対してアプローチしていきたいですね。

    キュレーションによって生成物の多様性を高めることでAI活用の幅を広げていきたいです。


    横原:最後に1点だけお伺いさせてください。先ほども仰られたように、日本にはアニメや漫画などの独特な文化が根ざしています。一方、コンテンツ制作がオープン化することによって、諸外国と比較してクリエイティブの優位性が失われるのではないかという懸念も感じています。これについて意見を頂ければと思います。


    ジェリー:確かに心配ではありますが、逆に現状を打破するためにAIの力が助けになると考えています。


    横原:それは「予算や人手が足りない」といった状況に対して、AIの力を借りることで海外と勝負ができる、いいチャンスが作れるといった部分にも繋がるということですね。


    ジェリー:そうですね。例えば「データ分析ができる人材が少ないために企業が成長しない」としたら、データ分析に長けたAIを活用して補完するという施策をとることも可能です。

    このように足りない部分をAIを活用し補完することで、日本が国際競争力を高めていく未来も当然あり得ると私は考えています。規制を強めたり、拒絶するのではなく積極的に活用していこうという姿勢が大事なのではないかと考えています。


    CGW:おふたりとも、本日はありがとうございました。


    横原:ありがとうございました。


    ジェリー:ありがとうございました。


    INTERVIEWER_横原大和(khaki)/Hirokazu Yokohara、中川裕介(CGWORLD)/Yusuke Nakagawa
    TEXT_神山大輝/Daiki Kamiyama
    EDIT_中川裕介(CGWORLD)/Yusuke Nakagawa