ゲームAI研究のスペシャリストが集結する、スクウェア・エニックス AI部(※)。2022年の発足以来、シンボリックAI、機械学習(機械学習を用いた自然言語処理を含む)、プロシージャルなコンテンツ生成など、様々な分野からゲームAI技術の研究・開発に挑み続けている。

今回は、そんなAI部の技術と研究成果を余すことなく紹介する技術書「スクウェア・エニックスのAI」の発売を記念し、書籍からAI部スタッフの座談会を4回にわたって転載。セクションリーダー篇では、第一線で活躍する各セクションのリーダーたちが「ゲームとAIの未来像」を語る。

記事の目次

    ※2024年4月の組織変更により、旧AI部を含む部門名・職種等に変更がありました。本記事および書籍「スクウェア・エニックスのAI」では、執筆時点の表記を用いております。

    関連記事

    ・AI部から生まれる、新しいゲームの可能性〜書籍刊行記念・スクウェア・エニックスAI部座談会
    若手メンバー編(1)若手メンバー編(2)

    Information

    スクウェア・エニックスのAI

    定価:5,500円(本体5,000円+税10%)
    発行・発売:株式会社 ボーンデジタル
    ISBN:978-4-86246-601-3
    総ページ数:336ページ
    サイズ:B5正寸、オールカラー
    発売日:2024年7月下旬
    電子版:準備中

    詳細・ご購入はこちらから

    メタAIで「ゲームの面白さ」を追求し続ける

    三宅陽一郎氏(以下、三宅):今回は、各分野の柱とも呼べるみなさんに、ゲームAIでこれからのゲーム体験がどう変わっていくのか、その未来像を聞いていきたいと思います。まずは、里井さんが研究を進める「メタAI」の可能性を伺いましょうか。

    三宅陽一郎/Youichiro Miyake
    スクウェア・エニックス AI部 ジェネラルマネージャー

    2022年よりAI部ジェネラル・マネージャー。2011年入社より、リードAIリサーチャー。京都大学で数学を専攻、大阪大学大学院(物理学修士)を経て、博士(工学、東京大学)。2004年よりデジタルゲームにおける人工知能の開発・研究に従事。ゲームAI技術の黎明期からAI技術を収集し、また独自の技術を開発しながら、ゲームAIの体系化とその発展を推進している。「大規模デジタルゲームにおける人工知能の一般的体系と実装-FINAL FANTASY XVの実例を基に-」にて2020年度人工知能学会論文賞を受賞。『FINAL FANTASY XIV』AIテクニカルアドバイザー、『FINAL FANTASY XV』リードAIアーキテクト、『KINGDOM HEARTS III』AIテクニカルディレクター、『FINAL FANTASY VII REMAKE』QA自動化AIテクニカルアドバイザー、などを手がける。日本デジタルゲーム学会理事、人工知能学会編集委員会副委員長、ゲーム情報学研究会運営委員。著書に『FINAL FANTASY XVの人工知能』(ボーンデジタル)など多数。CEDEC、GDC(Game Developers  Conference)、IEEE-CoG(Conference on Game)、SIGGRAPH、SIGGRAPH Asia、人工知能学会など国内外の学会・産業カンファレンスで講演・発表を多く行なっている(肩書、所属は2024年3月時点のもの)。

    里井:今までメタAIは、ゲーム全体をコントロールする存在として、プレイヤーから見えないところで活躍してきたのですが、今後は、AIの存在がプレイヤーにとっても「当たり前」になっていくと思います。

    里井大輝/Daiki Satoi
    スクウェア・エニックス AI部 AIリサーチャー

    筑波大学大学院博士後期課程修了後、2017年にスクウェア・エニックス入社。メタAIをはじめとする各種ゲームAIの研究開発、および『KINGDOM HEARTS III』(2019) などのゲームソフトへの導入に従事。ゲームUXに関する有志の社内サークルを共同設立し、知見の共有や蓄積にも取り組む。主な講演に「感情を揺さぶるメタAI ~ゲームへの実装方法とバランス調整への応用事例~」(CEDEC 2019)。博士(工学)。

    里井:これまでメタAIは、『ゼビウス』(1982)や 『Left4 Dead』(2008)にしても、プレイヤーによって難易度を調整したり、敵の出現度をコントロールしたり……。見えないところでこっそりバランスを調整して、面白く、より長く遊べるようにするという考え方が主流でした。

    しかし最近は、AI自体が世の中に普及し、より身近なものになってきましたよね。だからこそ今後は、AIがゲームを盛り上げる要素として「当たり前」になる。そのAIは仲間かもしれないし、敵かもしれないし、仲間でも敵でもない何かかもしれないけれど、「AIと一緒に遊ぶ」ということをどうしていくか。そこに大きな可能性があると感じています。

    三宅:なるほど。ゲームシステムの中に隠れていたものが、AIとして顕在化するという感じですね。それとユーザーがインタラクションするという……。

    里井:はい、そうですね。そして個人的には、さらに「面白さとは何か」を追求していきたいなと思っています。入社後、メタAIを用いて直接的にゲームを面白くするゲームAIの開発をしたり、開発の現場でそれをゲームAIにどう使えばいいかという課題の解決をいろいろ模索したり奮闘していますが、まだまだわかっていないことも多いなと感じています。

    それでも研究開発を進めるなかで、ゲームAIやメタAIにどんな課題があるのか、何が求められているのかという点は自分でも見えてきたと感じています。

    まだまだ課題も多いディープラーニングの活用

    三宅:機械学習の中でもディープラーニングはどんどん世の中に広まっていきましたが、ゲームの中にはまだ大きく使われていません。これからどんどん使われていくようになると思いますが、レアンドロさんはどう考えていますか。

    グラシア ヒル・レアンドロ氏(以下、レアンドロ):機械学習のツールと新しい制作方法が、ゲーム開発に大きな影響を与えると思います。例えば、ゲーム開発者が新しいアセットや新しいストーリーを制作するときなどに有益なツールになるでしょうね。最終的にはそうした技術がゲームに組み込まれていくと思いますが、実現するためには、技術的にまだまだ進化が必要なんです。

    なぜなら、機械学習モデルはどうしても大きなメモリを必要とするから。現時点では、小規模で単純なモデルしか利用できず、できることには限界があります。例えば、ChatGPTのようなものをゲームの中で動かそうとしても、メモリが大きすぎるのでまったく現実的ではないんですよね。

    グラシア ヒル・レアンドロ /Leandro, Gracia Gil
    スクウェア・エニックス AI部 シニアAIエキスパート

    スペイン生まれ。5歳からビデオゲームで遊び、11歳でプログラミングを始める。Googleに6年以上勤務し、2017年 にスクウェア・エニックスに入社。以来、『FINAL FANTASY VII REMAKE』(2020)などのタイトルに携わりながら、機械学 習を用いてビデオゲーム開発を改善し、新たなプレイ体験をもたらす方法を見つけることに注力している。


    レアンドロ:ハードウェアメーカーが機械学習向けアクセラレータの開発を優先的に進めてくれたら実現可能になりますが、まだまだ時間はかかると思います。それでも、機械学習モデルがコンパクト化し、効率的になり、ハードウェアもそれに対応するように進化していけば、ゲームに機械学習を組み込むことが可能になるでしょう。

    実際に、一部のゲームエンジンでは進歩も見受けられます。例えばUnityは、GPUを使用してディープラーニングの計算をシミュレーションしています。ゲーム機のグラフィックス機能を援用することで、ハードウェアがディープラーニング用に設計されていなくても、ディープラーニングを行うことができるのです。

    ですが、同じGPUをゲームのグラフィックス描写計算とも分け合うことになるので、これにも限界があるんですよね。いずれディープラーニングに特化した新しい部品が登場することで、より面白いことができるようになると期待しています。

    ボエダ・ゴティエ氏(以下、ゴティエ):GPU以外にも、オンライン上の計算リソースを使う方法はありますが、ゲームでディープラーニングモデルを動かすためにオンライン上の資源を用いることは、まだ一般的ではないですよね。最近は、深い階層にまで適応したニューラルネットワークをオンラインで動作させるゲームもいくつか見られますが。

    ボエダ・ゴティエ/Gautier Boeda
    スクウェア・エニックス AI部 AIエンジニア

    "Vulcanus In Japan"プログラム(日本とヨーロッパ間のインターンシップ)の参加者に選ばれ、スクウェア・エニックスのAIエンジニアとして来日。その後正式に入社し、現在はキャラクターインタラクションについて、研究・開発に取り組む。その研究の成果を国内外で催される多数のカンファレンスや学術会議(CEDEC、GDC、SIGGRAPH、IEEE-CoG、AIIDEなど)で発表する。キャラクターの感情システム(感情、気分、成果)や意思決定(プランニング技術やゴール思考システムなど)を開発し、最近は複数キャラクターのための自然な協力ができるシステムを研究・開発している。


    レアンドロ:そうですね。ただ、問題点もあります。オンライン上の計算リソースを活用するにはインターネット接続が必要なのですが、サービスがダウンしているとこの機能は使えません。だからこそ、ゲームの核心に関わる重要な部分に使用することはできないんです。

    三宅:コストの面など様々な課題もありますよね。ちなみにディープラーニングには、大規模言語モデル (LLM)から、テキストからの音声生成(TTS)までいろいろな活用分野がありますが、ゲームへの導入という面で可能性を感じているものはありますか。

    レアンドロ大量のテキストデータをAIが分析する「自然言語処理(NLP)」は、最も革新的な技術のひとつだと思います。特に、新しいキャラクターと会話できるようになることは非常に興奮しますね。もしかしたら、ゲームの進行度に合わせたクエスト自動生成システムをもっていた『The Elder ScrollsV: Skyrim』(2011)のように、新しい冒険を創り出すこともできるかもしれません。

    例えば言語モデルと、キャラクターの性格を模倣できるAIを組み合わせることができれば、新しいキャラクターとのチャットが可能になるでしょうし、動的にクエストを生成することもできるはず。つまり、よりダイナミックなコンテンツをつくり出すことができるようになると思います。

    ▲NLPがゲームに入ることでできること(書籍「スクウェア・エニックスのAI」より)

    レアンドロ:加えてTTSの技術によって新しい声を生成できるようになれば、プレイヤーがより臨場感のある体験ができると感じています。

    例えば、プレイヤーが部屋に入ると、たくさんのNPCキャラクターたちの会話が聞こえてくるとします。あるキャラクターに近づくと、特定の実際の会話を聞くことができるし、もう一人のキャラクターのところに行けばまた別の会話を聞くことになる。会話は繰り返されるものだとしても、声を毎回違うものにできればより現実感のあるプレイができると思います。

    ゴティエ:「強化学習」についてはいかがですか?

    レアンドロ:もちろん、「強化学習」も期待する技術のひとつです。主な用途のひとつは対戦相手の自動AIをつくることですが、最近では、大規模言語モデルの学習にも強化学習が使われるなど、様々なところで応用していけると思います。

    キャラクターインタラクションで生まれるゲームへの「没入感」

    三宅:ゴティエさんは音声認識とAI、キャラクターとプレイヤーのインタラクションについて研究されていますね。キャラクターインタラクションによって、これからのゲームがどんな風に変わっていくと思いますか。

    ゴティエ:キャラクターインタラクションはひとつの大きな分野であって、本当にいろいろな技術を扱っているんです。例えば機械学習にも使えるかもしれませんし、キャラクターの様々な感情を生成することもできるようになると思います。開発者が意図的にその場面の感情を設定しなくても、自動的に「このイベントならこの感情になる」とか、「このキャラクターの性格ならこう感じる」など、キャラクターがもっと自然に見えるようになるはずです。

    ただ、「コミュニケーション」の方はまだハードルが高いですね。例えば、プレイヤーがいろんなことをやっていても、周りのキャラクターたちは何もせず他のNPCとしゃべり続けている、プレイヤーのやっていることに気付かないなど、円滑なコミュニケーションができていない場面はまだまだ多いんです。大型ゲームではプレイヤーの意図を理解して反応をするキャラクターがいることも増えましたが、そこから人間と同等の反応ができるようになるまでは、まだ時間がかかると感じています。

    ▲開発用デモ「WONDER」(書籍「スクウェア・エニックスのAI」より)

    三宅:キャラクターインタラクションの研究は、アカデミックの方でも多く行われているのですか?

    ゴティエ:残念ながら、そこまで研究が進んでいないんですよね。機械学習は、グラフィックなどの分野がメインとなっている気がします。もちろん、ChatGPTをAIキャラクターに導入すると、どういうようなものができるのかという探求もありますけどね。

    三宅:ゴティエさんも、ディープラーニングや機械学習を取り入れて研究開発しているのですか?

    ゴティエ:まだ取り入れていません。レアンドロさんが説明したように、機械学習モデルはリソースの消費が激しいので、簡単にゲーム内で使用することができないんですよね。

    現在は、「機械学習が使えないなら、どのようなシステムを開発できるのか」といった視点で、ゲームで使えるものを研究しています。もちろん強化学習によって、小さいモデルをトレーニングする手法もあるので、そういった方向性からもアプローチしています。キャラクターの存在感が増すことで、プレイヤーの没入感がより深くなることを目指しています。

    柔軟なコントロール性とより人間らしい意思をもったAIをつくるには

    三宅:並木さんの開発しているゲームキャラクターの意思決定システムですが、「意思決定」は抽象的で少しわかりにくいところかもしれません。この研究開発でねらっているところ、ここを変えたらゲームが変わっていく、といった野望はありますか?

    並木幸介氏(以下、並木):スクウェア・エニックスらしい価値のあるゲームAIをつくっていきたいですね。特に意思決定システムは、今後10年で大きく変わると思っています。今の進化の状況って、1997年に『FINAL FANTASY Ⅶ』が出た時期と非常に似ています。

    ここ数年で深層学習や強化学習、大規模言語モデルなどの技術が発展してきましたが、一方ではこうした新しい技術をユーザーの手元に届けるためのハードウェアの開発が遅れています。ですが、考えてみると初代PlayStationが発売された後、『FINAL FANTASY Ⅶ』のような3Dモデルのゲームは一気に普及しました。それと同じ状況が今後10年のうちに起きると予想しています。

    深層学習を使った意思決定システムが「当たり前」の存在になります。ただ、そこで「深層学習が使えるようになりました」「強いエネミーがつくれるようになりました」という状況になったとしても、単に強いだけのAIをつくるのでは意味がありません。そこから「スクウェア・エニックスの価値を生み出せるか」を、何より考えるべきだと感じています。

    並木幸介/Kosuke Namiki
    スクウェア・エニックス AI部 シニアAIエンジニア

    2008年にゲーム業界でゲームプログラマとしてキャリアをスタートし、複数のコンソールゲーム開発でゲームAIを担当する。2012年スクウェア・エニックス入社。『FINAL FANTASY XV』や『KINGDOM HEARTS III』でエネミーAIの開発に携わる。現在はスクウェア・エニックスAI部で次世代ゲームAIの研究開発に従事している。最近の趣味はドライブとお城巡り。嫌いなものはエクセルで書かれたAI。

    並木:例えば、Sony AI、ポリフォニー・デジタル、ソニー・インタラクティブエンタテインメントの3社が共同開発した「Gran Turismo Sophy」は、強化学習を使ったレーシングゲームAIです。その特徴は、単純に「強い」というだけでなく、「倫理的にフェアなプレイ」をする点にあります。

    スポーツマンシップに則ったフェアなプレイをして、かつ強いというAIを実現しているんです。倫理感と、より人格的にふさわしい強さという、人間が憧れるような要素をもったAIなんですよね。そうした特徴をもったAIをいかに実現していくのか。これは今後も重要な視点になると思います。

    三宅:並木さんの開発している分野は、どちらかというと記号主義的なアプローチですよね。AI部でも、記号主義的な「シンボリックAIチーム」と「機械学習チーム」でわかれているのですが、意思決定の分野ではこの2つはどういう感じで融合していくと思われていますか?

    並木:ユーザーエクスペリエンスや、ゲームとしての娯楽性をもたらすためにも、この2つの分野の融合は必要だと考えています。

    機械学習の研究でよくあるのが、「人間よりも高い性能を発揮しました」というパターンですよね。最近だと大規模言語モデルを使ったプランニングが実現していますが、定量的な性能を達成しただけでは、娯楽としては成立しません。なぜなら、ゲームをプレイするユーザーは、定量的に強いだけのAIを求めてはいないからです。

    ユーザーは、「いかに達成感を得られるか」、「勝ちたいと思う敵と戦えるか」を重視しているのに対して、典型的な学習アルゴリズムでは「いかに最適に動かしていくか」という評価関数でしか制御できなくなってしまいます。機械学習に既存のシンボリックなシステムを融合させて、ゲームプランナーが考える強さにより近づけていけるかが、これからのゲームAI開発の課題になってくると考えています。

    ゴティエ:機械学習は最近、確かに強いキャラクターばかりをつくっていますよね。簡単なAIをつくりたい、楽しいAIをつくりたいと言っても、機械学習はできないんですね。そういう研究はあまり進んでいません。

    三宅:シンボリックAIは、カスタマイズしやすい点がありますからね。

    ゴティエ:ゲームデザイナーが喜ぶんですよね。

    三宅:でも、ディープラーニングはすごく細かいところまで学習してくれる細やかさがありますし……。

    ゴティエ:そうですね。でも、結局ブラックボックスみたいな感じになってしまうとデザイナーが使えなくなってしまいますからね。

    三宅:デザイナーさんが使いやすいシステムにするには、という部分はゲーム産業特有の問題ですよね。エンジニアがゲーム全体をつくっているわけじゃありませんから。

    並木:大規模言語モデルからのアプローチですと、将来的には言語モデルがプランニングやビヘイビアツリー(※)のデータを自動で出力してくれるという可能性もありますね。

    例えば、ゲームデザイナーがゲームエンジンに対して「こういう動きをしてください」というプロンプトを打ち込んだら、戦ってくれるエネミーのビヘイビアツリーをゲームエンジンが自動で実装してくれるなど。そういう可能性もあるので、一概に深層学習、強化学習に乗せることだけが未来ではないなと思っています。

    ※ビヘイビアツリー:敵やNPCなどのAIキャラクターに独自の意思決定をさせたいときなどに使われる技術モデル

    レアンドロ:機械学習で見落とされがちな側面のひとつに、「コントローラビリティ」が挙げられると思います。ゲームの目的やゲームデザインのためには何を得るかを非常に細かく制御する必要があるんですよね。そもそも、AIの出力は、常に完璧で正しいものとは限りません。正しさはもちろんですが、重要なのは微調整やコントロールが非常に簡単であること。デザイナーやアニメーター、ディレクターなどの作業者が、変更したいと思う部分を簡単に編集できるようなAIを開発する方が重要だと思います。

    三宅:デザイナー、ディレクターなどがディープラーニングをもつシステムを思い通りに操作できるコントローラビリティは本当に重要ですよね。ゲーム産業ではエンジニアじゃない人がカスタマイズできないといけないですし。里井さんはメタAIの立場から、機械学習をどういうふうに見ていますか。

    里井:機械学習、ディープラーニングに限らず、昔からアルゴリズムが何かを生成するゲームの研究や、それを利用した作品というのはいろいろ出ていますけど、「生成できれば何でもいい」というわけじゃないんですよね。いかに制約をかけるかというところが、ジェネレーションのクオリティを決定するといわれていますし、工夫のしどころがあると考えています。

    アルゴリズムに対するコントローラビリティをデザインするには、ゲームデザイナーがやりたいことを、AIをつくる側の人がいかに落とし込めるか考えなければいけません。でも、現状だとあまり知見が整理されていないところが多いですね。

    それこそ、先ほど並木さんが言っていた「エネミーは強いだけじゃなく、倫理感のあるプレイができるといいよね」っていうのもそのひとつだと思いますし、「バトル相手のキャラクターがプレイヤーに理不尽な攻撃をしてないかどうか」なども、実際のプロダクトですごく気を遣われている部分だと思います。

    でもその「理不尽さを感じない」って突き詰めるとすごく複雑な問題ですし、じゃあそれってどうやって実現するのか? という部分に関しても、もっと議論が必要ですね。今後はもっと、そうして得た知識を蓄積していかないといけないな、と感じています。

    セクションリーダー篇(2)に続く(近日公開予定)>>

    TEXT_室井美優 / Miyu Muroi(Playce
    EDIT_小村仁美 / Hitomi Komura(CGWORLD)、高木 了 / Satoru Takagi
    PHOTO_弘田 充 / Mitsuru Hirota