AIを味方につけたデジタルアートの行方とは? クリエイティブ集団khakiに聞く NVIDIA RTX A2000搭載 Dell Precision 5560 の実力
すでにAIを活用した機能の実用化が進む映像制作現場において、第3世代Tensorコアを備えたRTX A2000搭載のモバイルワークステーションDell Precision 5560はどのような恩恵をもたらすのか。
同機を用い、khaki のエンバイロンメントアーティスト兼ジェネラリスト・田崎陽太氏に、これまでにないAIを用いたワークフローによるコンセプトアート制作を実践してもらった。
AI技術がもたらす映像制作スタイルの変革
数多ある産業の中でも、AI技術が3DCG/VFX業界に与えるインパクトは特に大きい。最新技術を取り入れた柔軟なワークフロー構築を得意とするKhakiの田崎陽太氏によれば、映像制作の現場ではすでにAIツールの実用化が進んでいるという。「単純作業において、AIを活用したツールは非常に強力です。映像制作で言えばマスクを切る、選択ラインを検出するなど、これまでは人の手で細かく行なっていた単純作業の代替として活用が進んでいます。個人的にはAIによるモーションキャプチャ技術に注目しており、3Dスキャンによるモデリングなども含めて映像の制作スタイルは大きく変わってくると予想しています」(田崎氏)。
さらに、将来的にはより複雑でクリエイティブな上流工程での活用もおおいに見込まれるという。例えば、田崎氏が得意とするコンセプトアート制作では従来リファレンスを組み合わせてイメージを構築していくことが多かったが、現在は入力したキーワードに応じてイメージを生成するという研究も進んでいる。Khakiでは、機械学習モデルで自動生成したアートワークを組み合わせて提案するワークフローの検討も実験的に進めているという。
Blenderでレンダリングしたものをイニシャルイメージにして機械学習を通してアニメーション生成。
— Masaki Mizuno (@MIZNOM) February 18, 2022
他にも文章に”arnold” “cinema4D” “amazing photorealistic”とか入れて色々テストしてみたけど、ただツヤツヤの何かになるだけだった。その辺もうちょい探りたい。#blender #deeplearning pic.twitter.com/TSXu7DdD9a
“夕日の雪山に立つロボット”
— Masaki Mizuno (@MIZNOM) February 14, 2022
という文書から113枚のペイントアニメーションを機械学習で生成。
動画をイニシャルイメージに設定したから、カメラワークと構図をそのまま活かせるのが面白い。
手書きで作りました!って言われても信じちゃうレベル。
(CLIP Guided Diffusion) rendering 18H pic.twitter.com/46ziE1jxXX
また、AI技術が与えるもうひとつのインパクトは、熟練の作業者と若手のクオリティの差が埋まっていくこと。「現在のDCCツールは道具であり、使い手によってクオリティに差が出ます。一方AI技術を用いたツールは、ベテランでも新人でも、使い方が統一されれば同じ結果が出力される。すでにマスク作業などはそうなりつつありますが、今後はさらに経験の差が埋まっていくだろうと考えます」(田崎氏)。
現時点ではR&D段階にとどまるツール群が多いものの、数年で制作環境が一変する可能性は極めて高い。今できることは、自分の技術を日々磨きながら、ゲームチェンジャーになり得る技術を見逃さないために最新技術に常にアンテナを張っておくことだと田崎氏は語っている。
NIVDIA Canvasを活用したコンセプトアート制作
田崎氏の得意とするコンセプトアート制作におけるAI活用の実例として、今回は「NVIDIA Canvas」と「Photoshop ニューラルフィルター」を組み合わせたワークフローの検証を実施。検証機には80基の第3世代Tensorコアを備えたラップトップ向けNVIDIA RTX A2000搭載のモバイルワークステーション Dell Precision 5560を使用し、「丘の上にそびえる中世の城と騎士」という4Kサイズのコンセプトアート制作が行われた。
背景制作に用いた「NVIDIA Canvas」は、ユーザーが描いた線や形などのラフスケッチから瞬時にリアリスティックな風景画を自動生成するアプリケーションで、GeForceおよびNVIDIA RTX GPUユーザーであれば無償で使用することができる。基本的なしくみとしては敵対的生成ネットワーク(GAN)を利用した画像生成ツールと捉えることができ、500万枚以上の学習データに基づく模倣画像を素材マップからリアルタイムにつくり出すというもの。とはいえ、技術的なことをまったく気にせず使用することができるのが最大の利点だと田崎氏は説明する。
「操作に慣れたり、クセを掴むまでに少し時間はかかりましたが、ラフに描くのであれば数分でできるレベルだと思います。Canvasは塗りによって出力される画像が大きく変わるので、最初は広めに色を塗っていき、一部を消し込んだりしながらAIが良いパターンを出してくれるまでくり返しました」(田崎氏)。
ユーザーの操作はSky(空)、Cloud(雲)、Snow(雪)などのマテリアルを選択し、線を引いたり、塗りつぶしたりするだけ。田崎氏はある程度AIの偶然性に任せてペンを走らせ、全体的な形が見えてきたら細かくエディットしていくというながれで、写実的な風景を30分程度でつくることができたという。AIによる4Kサイズの自動生成にも関わらず動作はほぼリアルタイムで、極めて高速な描画が実現できていた。
「動作はかなり快適でした。このスピード感でつくっていけるなら、今後はDell Precision 5560を制作現場に持ち運んで、ディレクターと一緒にリアルタイムで画をつくっていくこともできそうですね」(田崎氏)。
Photoshop ニューラルフィルターでの検証
Photoshopでの合成作業では、AIを活用したツールである「ニューラルフィルター」が多用された。Adobeは2016年に「Adobe Sensei」を発表以来、AIと機械学習による革新的な機能を数多くリリースしてきたが、中でもニューラルフィルターはとりわけ大きな話題を呼んでいた。同機能はインポートした画像に対し、人物なら表情付けや年齢変更、背景なら空の色の変更や背景合成などの効果を付与する機能で、2021年末に登場した「風景ミキサー」機能を用いれば緑化や積雪など背景の全体的な調整を自動で行うことも可能となる。
検証ではNVIDIA Canvasからエクスポートした.psdデータをPhotoshopで展開し、オブジェクト選択ツールで自動的に切り抜いた騎士と城(モン・サン=ミシェル)の写真をニューラルフィルターの「調和」機能を用いて合成。その後、風景ミキサーを用いていくつかのパターン出しを行うというながれで作成された。「オブジェクトの自動判定による切り抜きから、合成した騎士と城の写真の色調を背景と馴染ませるところまでが全て自動で行われています。NVIDIA Canvasで描いた背景と写真素材の合成は非常にスムーズに行えました」(田崎氏)。
風景ミキサーでは、背景を一面の草原にしたり、荒野や降り積もる雪を試したりといったアイデア出しを行い、同時に「カラーの適用」による色調変更で雰囲気を調整していたが、高負荷がかかる同機能においても数秒の待ち時間で結果が出力されていたという。「AI機能を使わずに積雪や荒野などにレタッチするのは相当大変だと思います。使うと使わないでは、半日くらい制作スピードが変わってくるかもしれませんね」(田崎氏)。
「カラーの適用」ではプリセットのほか、カスタムで画像を読み込んで独自のカラールックアップを作成することもでき、調整もほぼリアルタイムで動作するなど非常に実用的な機能となっている。現時点では騎士が背景として扱われてしまったり、細部の整合性が合わないといった精度不足の面もあるが、それでもアイデア出しの時点では強力な武器になる。
Dell Precision 5560はモバイルワークステーションながら、これらの作業は田崎氏が業務で用いるデスクトップマシンとも遜色ないレベルで実現できたとのこと。ニューラルフィルターの処理速度はGPUに依存するため、第3世代Tensorコアを搭載したNIVIDIA RTX Aシリーズであれば、今後は場所を問わず具体的なイメージを生成することができるようになるはずだ。
◆スペック比較
・田崎氏の業務用デスクトップPC
GPU:NVIDIA GeForce RTX 3090
CPU:AMD Ryzen Threadripper 3990X
メモリ:128GB
・Dell Precision 5560
GPU:NVIDIA RTX A2000 Laptop w/4GB
CPU:インテル Core i7-11850H (8 コア, 2.50 GHz〜4.80 GHz)
メモリ:16 GB
CUDAコア数が倍増! AI技術をフルに引き出す、NVIDIA RTX Ampereシリーズ
ここ数年間でクリエイティブワークをモバイル環境で行う事例は増加し、国内でも急速にモバイルワークステーションの導入が広がっている。すでに海外市場ではデスクトップ型よりもラップトップ型の割合が高く、3DCGや映像制作は場所を選ばずに行うことも多いが、将来的にこうした作業の中にAIを活用したツールや機能が取り入れられていくことは想像に難くない。
こうした技術領域をリードするNVIDIAは、Quadro RTXシリーズの後継製品として第2世代RTX Aシリーズを発表。検証に用いたDell Precision 5560に採用されたラップトップ向けRTX A2000は、一新されたGPUラインナップの中ではエントリーモデルながら、第2世代RTコア、第3世代Tensorコアを備え、リアルタイムレイトレーシングやレンダリングを高速化させるだけでなくニューラルフィルターなど機械学習にも完全に適合する。
「RTX A2000とTuring世代のRTX T2000を比較すると、CUDAコア数は2倍以上になっています。もちろんサイズが2倍に大きくなっているわけではなく、プロセスルールが小さくなったためにコア数を担保できるようになっています。電源容量的にもほぼ差はありません」(NVIDIA プロフェッショナル ビジュアライゼーション ビジネスデベロップメントマネージャー・高橋 想氏)。
ラップトップ向けのGPUは第3世代Max-Qテクノロジーによる電源供給の効率化、ファンの回転数管理による低ノイズ化を実現しており、Dell Precisionシリーズのような薄型筐体でも問題なく搭載できるようになっている。Precisionシリーズの効率的なエアフロー設計もあり、田崎氏も「排熱もなく、静かで快適に使えました。本機でもクリエイティブな作業は問題なくできますし、3Dモデリングや静止画のレンダリングなどにもまったくストレスがないだろうと感じています」と評価した。
RTX A2000はデスクトップ向けにもリリースされており、70Wの消費電力ながらVRAMを最大12GB備えるほか、GPU本体が極めてコンパクトであること自体も注目を集めている。デスクトップ向けの小型GPUが示されたことで、今後はモバイルワークステーションのほかに「容易に持ち運びが可能なデスクトップ」という選択肢が生まれる可能性もある。
「マシンの小型化は非常に喜ばしいですし、AシリーズのVRAM容量にも興味があります。khakiではGPUレンダラを使用しており、VRAM容量が生命線であるため普段からRTX 3090を使っています。GPUレンダリングは基本的にVRAM容量に収まる範囲しかレンダリングできないため、スピードよりもメモリを重要視しています。価格との相談になりますが、VRAM 48GBを備えるRTX A6000が選択肢にあるのも良いですね」(田崎氏)。
さらなる進化を遂げたAIによるワークフローの変革をおおいに期待すると共に、これらのベースとなるRTXテクノロジーをいち早く取り入れることを検討したい。
TEXT_神山大輝(NINE GATES STUDIO)
EDIT_藤井紀明(CGWORLD)
INTERVIEW_池田大樹(CGWORLD)