ゲームAI研究のスペシャリストが集結する、スクウェア・エニックス AI部(※)。2022年の発足以来、シンボリックAI、機械学習(機械学習を用いた自然言語処理を含む)、プロシージャルなコンテンツ生成など、様々な分野からゲームAI技術の研究・開発に挑み続けている。
今回は、そんなAI部の技術と研究成果を余すことなく紹介する技術書「スクウェア・エニックスのAI」の発売を記念し、書籍からAI部スタッフの座談会を4回にわたって転載。セクションリーダー篇では、第一線で活躍する各セクションのリーダーたちが「ゲームとAIの未来像」を語る。
関連記事
・AI部から生まれる、新しいゲームの可能性〜書籍刊行記念・スクウェア・エニックスAI部座談会
若手メンバー編(1)/若手メンバー編(2)
Information
スクウェア・エニックスのAI
定価:5,500円(本体5,000円+税10%)
発行・発売:株式会社 ボーンデジタル
ISBN:978-4-86246-601-3
総ページ数:336ページ
サイズ:B5正寸、オールカラー
発売日:2024年7月下旬
電子版:準備中
メタAIで「ゲームの面白さ」を追求し続ける
三宅陽一郎氏(以下、三宅):今回は、各分野の柱とも呼べるみなさんに、ゲームAIでこれからのゲーム体験がどう変わっていくのか、その未来像を聞いていきたいと思います。まずは、里井さんが研究を進める「メタAI」の可能性を伺いましょうか。
里井:今までメタAIは、ゲーム全体をコントロールする存在として、プレイヤーから見えないところで活躍してきたのですが、今後は、AIの存在がプレイヤーにとっても「当たり前」になっていくと思います。
里井:これまでメタAIは、『ゼビウス』(1982)や 『Left4 Dead』(2008)にしても、プレイヤーによって難易度を調整したり、敵の出現度をコントロールしたり……。見えないところでこっそりバランスを調整して、面白く、より長く遊べるようにするという考え方が主流でした。
しかし最近は、AI自体が世の中に普及し、より身近なものになってきましたよね。だからこそ今後は、AIがゲームを盛り上げる要素として「当たり前」になる。そのAIは仲間かもしれないし、敵かもしれないし、仲間でも敵でもない何かかもしれないけれど、「AIと一緒に遊ぶ」ということをどうしていくか。そこに大きな可能性があると感じています。
三宅:なるほど。ゲームシステムの中に隠れていたものが、AIとして顕在化するという感じですね。それとユーザーがインタラクションするという……。
里井:はい、そうですね。そして個人的には、さらに「面白さとは何か」を追求していきたいなと思っています。入社後、メタAIを用いて直接的にゲームを面白くするゲームAIの開発をしたり、開発の現場でそれをゲームAIにどう使えばいいかという課題の解決をいろいろ模索したり奮闘していますが、まだまだわかっていないことも多いなと感じています。
それでも研究開発を進めるなかで、ゲームAIやメタAIにどんな課題があるのか、何が求められているのかという点は自分でも見えてきたと感じています。
まだまだ課題も多いディープラーニングの活用
三宅:機械学習の中でもディープラーニングはどんどん世の中に広まっていきましたが、ゲームの中にはまだ大きく使われていません。これからどんどん使われていくようになると思いますが、レアンドロさんはどう考えていますか。
グラシア ヒル・レアンドロ氏(以下、レアンドロ):機械学習のツールと新しい制作方法が、ゲーム開発に大きな影響を与えると思います。例えば、ゲーム開発者が新しいアセットや新しいストーリーを制作するときなどに有益なツールになるでしょうね。最終的にはそうした技術がゲームに組み込まれていくと思いますが、実現するためには、技術的にまだまだ進化が必要なんです。
なぜなら、機械学習モデルはどうしても大きなメモリを必要とするから。現時点では、小規模で単純なモデルしか利用できず、できることには限界があります。例えば、ChatGPTのようなものをゲームの中で動かそうとしても、メモリが大きすぎるのでまったく現実的ではないんですよね。
レアンドロ:ハードウェアメーカーが機械学習向けアクセラレータの開発を優先的に進めてくれたら実現可能になりますが、まだまだ時間はかかると思います。それでも、機械学習モデルがコンパクト化し、効率的になり、ハードウェアもそれに対応するように進化していけば、ゲームに機械学習を組み込むことが可能になるでしょう。
実際に、一部のゲームエンジンでは進歩も見受けられます。例えばUnityは、GPUを使用してディープラーニングの計算をシミュレーションしています。ゲーム機のグラフィックス機能を援用することで、ハードウェアがディープラーニング用に設計されていなくても、ディープラーニングを行うことができるのです。
ですが、同じGPUをゲームのグラフィックス描写計算とも分け合うことになるので、これにも限界があるんですよね。いずれディープラーニングに特化した新しい部品が登場することで、より面白いことができるようになると期待しています。
ボエダ・ゴティエ氏(以下、ゴティエ):GPU以外にも、オンライン上の計算リソースを使う方法はありますが、ゲームでディープラーニングモデルを動かすためにオンライン上の資源を用いることは、まだ一般的ではないですよね。最近は、深い階層にまで適応したニューラルネットワークをオンラインで動作させるゲームもいくつか見られますが。
レアンドロ:そうですね。ただ、問題点もあります。オンライン上の計算リソースを活用するにはインターネット接続が必要なのですが、サービスがダウンしているとこの機能は使えません。だからこそ、ゲームの核心に関わる重要な部分に使用することはできないんです。
三宅:コストの面など様々な課題もありますよね。ちなみにディープラーニングには、大規模言語モデル (LLM)から、テキストからの音声生成(TTS)までいろいろな活用分野がありますが、ゲームへの導入という面で可能性を感じているものはありますか。
レアンドロ:大量のテキストデータをAIが分析する「自然言語処理(NLP)」は、最も革新的な技術のひとつだと思います。特に、新しいキャラクターと会話できるようになることは非常に興奮しますね。もしかしたら、ゲームの進行度に合わせたクエスト自動生成システムをもっていた『The Elder ScrollsV: Skyrim』(2011)のように、新しい冒険を創り出すこともできるかもしれません。
例えば言語モデルと、キャラクターの性格を模倣できるAIを組み合わせることができれば、新しいキャラクターとのチャットが可能になるでしょうし、動的にクエストを生成することもできるはず。つまり、よりダイナミックなコンテンツをつくり出すことができるようになると思います。
レアンドロ:加えてTTSの技術によって新しい声を生成できるようになれば、プレイヤーがより臨場感のある体験ができると感じています。
例えば、プレイヤーが部屋に入ると、たくさんのNPCキャラクターたちの会話が聞こえてくるとします。あるキャラクターに近づくと、特定の実際の会話を聞くことができるし、もう一人のキャラクターのところに行けばまた別の会話を聞くことになる。会話は繰り返されるものだとしても、声を毎回違うものにできればより現実感のあるプレイができると思います。
ゴティエ:「強化学習」についてはいかがですか?
レアンドロ:もちろん、「強化学習」も期待する技術のひとつです。主な用途のひとつは対戦相手の自動AIをつくることですが、最近では、大規模言語モデルの学習にも強化学習が使われるなど、様々なところで応用していけると思います。
キャラクターインタラクションで生まれるゲームへの「没入感」
三宅:ゴティエさんは音声認識とAI、キャラクターとプレイヤーのインタラクションについて研究されていますね。キャラクターインタラクションによって、これからのゲームがどんな風に変わっていくと思いますか。
ゴティエ:キャラクターインタラクションはひとつの大きな分野であって、本当にいろいろな技術を扱っているんです。例えば機械学習にも使えるかもしれませんし、キャラクターの様々な感情を生成することもできるようになると思います。開発者が意図的にその場面の感情を設定しなくても、自動的に「このイベントならこの感情になる」とか、「このキャラクターの性格ならこう感じる」など、キャラクターがもっと自然に見えるようになるはずです。
ただ、「コミュニケーション」の方はまだハードルが高いですね。例えば、プレイヤーがいろんなことをやっていても、周りのキャラクターたちは何もせず他のNPCとしゃべり続けている、プレイヤーのやっていることに気付かないなど、円滑なコミュニケーションができていない場面はまだまだ多いんです。大型ゲームではプレイヤーの意図を理解して反応をするキャラクターがいることも増えましたが、そこから人間と同等の反応ができるようになるまでは、まだ時間がかかると感じています。
三宅:キャラクターインタラクションの研究は、アカデミックの方でも多く行われているのですか?
ゴティエ:残念ながら、そこまで研究が進んでいないんですよね。機械学習は、グラフィックなどの分野がメインとなっている気がします。もちろん、ChatGPTをAIキャラクターに導入すると、どういうようなものができるのかという探求もありますけどね。
三宅:ゴティエさんも、ディープラーニングや機械学習を取り入れて研究開発しているのですか?
ゴティエ:まだ取り入れていません。レアンドロさんが説明したように、機械学習モデルはリソースの消費が激しいので、簡単にゲーム内で使用することができないんですよね。
現在は、「機械学習が使えないなら、どのようなシステムを開発できるのか」といった視点で、ゲームで使えるものを研究しています。もちろん強化学習によって、小さいモデルをトレーニングする手法もあるので、そういった方向性からもアプローチしています。キャラクターの存在感が増すことで、プレイヤーの没入感がより深くなることを目指しています。
柔軟なコントロール性とより人間らしい意思をもったAIをつくるには
三宅:並木さんの開発しているゲームキャラクターの意思決定システムですが、「意思決定」は抽象的で少しわかりにくいところかもしれません。この研究開発でねらっているところ、ここを変えたらゲームが変わっていく、といった野望はありますか?
並木幸介氏(以下、並木):スクウェア・エニックスらしい価値のあるゲームAIをつくっていきたいですね。特に意思決定システムは、今後10年で大きく変わると思っています。今の進化の状況って、1997年に『FINAL FANTASY Ⅶ』が出た時期と非常に似ています。
ここ数年で深層学習や強化学習、大規模言語モデルなどの技術が発展してきましたが、一方ではこうした新しい技術をユーザーの手元に届けるためのハードウェアの開発が遅れています。ですが、考えてみると初代PlayStationが発売された後、『FINAL FANTASY Ⅶ』のような3Dモデルのゲームは一気に普及しました。それと同じ状況が今後10年のうちに起きると予想しています。
深層学習を使った意思決定システムが「当たり前」の存在になります。ただ、そこで「深層学習が使えるようになりました」「強いエネミーがつくれるようになりました」という状況になったとしても、単に強いだけのAIをつくるのでは意味がありません。そこから「スクウェア・エニックスの価値を生み出せるか」を、何より考えるべきだと感じています。
並木:例えば、Sony AI、ポリフォニー・デジタル、ソニー・インタラクティブエンタテインメントの3社が共同開発した「Gran Turismo Sophy」は、強化学習を使ったレーシングゲームAIです。その特徴は、単純に「強い」というだけでなく、「倫理的にフェアなプレイ」をする点にあります。
スポーツマンシップに則ったフェアなプレイをして、かつ強いというAIを実現しているんです。倫理感と、より人格的にふさわしい強さという、人間が憧れるような要素をもったAIなんですよね。そうした特徴をもったAIをいかに実現していくのか。これは今後も重要な視点になると思います。
三宅:並木さんの開発している分野は、どちらかというと記号主義的なアプローチですよね。AI部でも、記号主義的な「シンボリックAIチーム」と「機械学習チーム」でわかれているのですが、意思決定の分野ではこの2つはどういう感じで融合していくと思われていますか?
並木:ユーザーエクスペリエンスや、ゲームとしての娯楽性をもたらすためにも、この2つの分野の融合は必要だと考えています。
機械学習の研究でよくあるのが、「人間よりも高い性能を発揮しました」というパターンですよね。最近だと大規模言語モデルを使ったプランニングが実現していますが、定量的な性能を達成しただけでは、娯楽としては成立しません。なぜなら、ゲームをプレイするユーザーは、定量的に強いだけのAIを求めてはいないからです。
ユーザーは、「いかに達成感を得られるか」、「勝ちたいと思う敵と戦えるか」を重視しているのに対して、典型的な学習アルゴリズムでは「いかに最適に動かしていくか」という評価関数でしか制御できなくなってしまいます。機械学習に既存のシンボリックなシステムを融合させて、ゲームプランナーが考える強さにより近づけていけるかが、これからのゲームAI開発の課題になってくると考えています。
ゴティエ:機械学習は最近、確かに強いキャラクターばかりをつくっていますよね。簡単なAIをつくりたい、楽しいAIをつくりたいと言っても、機械学習はできないんですね。そういう研究はあまり進んでいません。
三宅:シンボリックAIは、カスタマイズしやすい点がありますからね。
ゴティエ:ゲームデザイナーが喜ぶんですよね。
三宅:でも、ディープラーニングはすごく細かいところまで学習してくれる細やかさがありますし……。
ゴティエ:そうですね。でも、結局ブラックボックスみたいな感じになってしまうとデザイナーが使えなくなってしまいますからね。
三宅:デザイナーさんが使いやすいシステムにするには、という部分はゲーム産業特有の問題ですよね。エンジニアがゲーム全体をつくっているわけじゃありませんから。
並木:大規模言語モデルからのアプローチですと、将来的には言語モデルがプランニングやビヘイビアツリー(※)のデータを自動で出力してくれるという可能性もありますね。
例えば、ゲームデザイナーがゲームエンジンに対して「こういう動きをしてください」というプロンプトを打ち込んだら、戦ってくれるエネミーのビヘイビアツリーをゲームエンジンが自動で実装してくれるなど。そういう可能性もあるので、一概に深層学習、強化学習に乗せることだけが未来ではないなと思っています。
レアンドロ:機械学習で見落とされがちな側面のひとつに、「コントローラビリティ」が挙げられると思います。ゲームの目的やゲームデザインのためには何を得るかを非常に細かく制御する必要があるんですよね。そもそも、AIの出力は、常に完璧で正しいものとは限りません。正しさはもちろんですが、重要なのは微調整やコントロールが非常に簡単であること。デザイナーやアニメーター、ディレクターなどの作業者が、変更したいと思う部分を簡単に編集できるようなAIを開発する方が重要だと思います。
三宅:デザイナー、ディレクターなどがディープラーニングをもつシステムを思い通りに操作できるコントローラビリティは本当に重要ですよね。ゲーム産業ではエンジニアじゃない人がカスタマイズできないといけないですし。里井さんはメタAIの立場から、機械学習をどういうふうに見ていますか。
里井:機械学習、ディープラーニングに限らず、昔からアルゴリズムが何かを生成するゲームの研究や、それを利用した作品というのはいろいろ出ていますけど、「生成できれば何でもいい」というわけじゃないんですよね。いかに制約をかけるかというところが、ジェネレーションのクオリティを決定するといわれていますし、工夫のしどころがあると考えています。
アルゴリズムに対するコントローラビリティをデザインするには、ゲームデザイナーがやりたいことを、AIをつくる側の人がいかに落とし込めるか考えなければいけません。でも、現状だとあまり知見が整理されていないところが多いですね。
それこそ、先ほど並木さんが言っていた「エネミーは強いだけじゃなく、倫理感のあるプレイができるといいよね」っていうのもそのひとつだと思いますし、「バトル相手のキャラクターがプレイヤーに理不尽な攻撃をしてないかどうか」なども、実際のプロダクトですごく気を遣われている部分だと思います。
でもその「理不尽さを感じない」って突き詰めるとすごく複雑な問題ですし、じゃあそれってどうやって実現するのか? という部分に関しても、もっと議論が必要ですね。今後はもっと、そうして得た知識を蓄積していかないといけないな、と感じています。
セクションリーダー篇(2)に続く(近日公開予定)>>
TEXT_室井美優 / Miyu Muroi(Playce)
EDIT_小村仁美 / Hitomi Komura(CGWORLD)、高木 了 / Satoru Takagi
PHOTO_弘田 充 / Mitsuru Hirota