64コア128スレッドのAMD 3995WX ＆ NVIDIA史上最もハイスペックなRTX A6000を搭載したモンスターマシン「Lenovo ThinkStation P620」をコロッサス澤田氏が徹底検証！

[PR]

Lenovoが展開するワークステーションThinkStaionシリーズの中でも、3DCG制作やVR、データサイエンスに向けたハイエンドモデルとなる「P620」。今回はAMD 3995WX、RTX A6000という構成の検証機を、株式会社コロッサスレンダリングスペシャリストの澤田氏に多角的視点から検証して頂いた。

TEXT＿神山大輝／ Daiki Kamiyama（NINE GATES STUDIO）
PHOTO＿弘田充／Mitsuru Hirota
INTERVIEW＿阿部祐司／Yuji Abe（CGWORLD）

業界最高水準のスペックで検証

CGWORLD（以下、CGW）：まずは自己紹介をお願いします。

澤田氏（以下、澤田氏）：コロッサスの澤田と申します。弊社は映像制作会社で、ゲーム関係の映像やキャラクターアセットなどを制作したり、映像案件や遊技機などの制作に携わっています。また、本業とは別に専門学校の講師業もやっています。一昨年まではセミナーや講演の仕事も多く、Autodeskさんの記事などを執筆する機会もありました。今日お話することも、恐らく日本の中ではWebサイト含めて正確な情報が手に入りにくい内容についても触れていますので、是非楽しんでいってください。

澤田友明氏／Tomoaki Sawada（コロッサス）株式会社コロッサスシニアデザイナー。広告業界やB2B関係のCG制作で長年R&Dを担当。グローバルイルミネーションレンダラについても初期段階から様々な検証を行なってきた。現在は同社でCGディレクションやR&Dを担当している。趣味はカメラで富士フィルムを愛用。自宅ではAMD製CPUを搭載した自作PCを愛用している。

CGWORLD（以下、CGW）：ありがとうございます。さっそく検証結果を拝見したいのですが、まずは今回の検証機と、比較対象となったご自身のPCのスペックをご紹介ください。

澤田氏：今回は最高水準のスペックで検証をさせて頂いたので、結果としても興味深いものになりました。Intel Core i9-9900K、AMD Ryzen 9 5950Xは一般層向けのハイスペック機種、64core/128ThreadのAMD Ryzen Threadripper PRO 3995WXは現状では単体で最高の性能だと思います。まずはCPUを酷使できる内容として、検証はAutodesk ArnoldによるCPUレンダリングの速度測定を行いました。結果はIntel 9900K(8core/16Thread）が25分16秒、AMD 5950X（16core/32Thread）が12分23秒、AMD 3995WX（64core/128Thread）が4分15秒となりました。コア数だけで見れば4倍になりますが、コア数が増えた分、熱処理の問題で動作周波数が落ちたり、アーキテクチャー世代の違い、メモリーやネットワーク通信などの処理がボトルネックになる場合もあるため、処理速度は単純に４倍になるわけではありません。

ArnoldでのCPUレンダリング検証

CGW：コア数に比例しておよそ3倍の速度と、想定通りの結果に近いと思います。

澤田氏：CPU使用率は100％近辺でしたし、概ね3倍の性能差は想定内でした。ArnoldでのCPUレンダリングは素直に性能が出るテストなので、コストパフォーマンスを考えるのであればAMD 5950Xや3995WXは選択肢としては良いと思っています。また64コアの並列処理能力が1ソケットのコンパクト筐体に収まっている今回の検証機は、現場では単なるレンダリング処理時間の向上にとどまらない価値があるかもしれません。

CGW：続いてBifrostによるシミュレーションの検証をしていただきました。

澤田氏：BifrostはAutodesk Maya 2018から標準搭載されたノードベースのエフェクトツールです。従来はHoudiniでやっていたような作業をMaya上で実現可能にしたプラグインで、個人的にはSoftimageの系譜がここに生きている感覚がありますね。特徴としてはMayaのアニメーションに直接エフェクトシミュレーションを合わせることができるという点と、シェーダーやライトの影響が正確にビューポート表示できるというところです。Bifrostでは、3つのテストシーンで30Fレンダリングを行い、速度測定を行いました。画像はいずれも左側がプレビュー、右側がノードグラフになります。

Bifrostでのエフェクト検証

Bifrostでのエフェクト検証とシミュレーション時間比較

澤田氏：AeroExplosion（テストシーンA）は、炎が燃えあがるエフェクトです。9900Kが2分01秒、5950Xが1分14秒、3995WXが37秒という結果になりました。AeroSmoke（テストシーンB）は9900Kが40秒、5950Xが27秒、3995WXが32秒となっています。テストシーンCは爆発系のエフェクトで、これは9900Kが2分58秒、5950Xが1分43秒、3995WXが56秒となりました。この結果から、ひとつだけおかしな点が見えますね。

CGW：シーンBの検証結果ですね。AeroSmokeだけは3995WXが思いのほか時間が掛かっていて、AMD同士で比較するとコア数の少ない5950Xの方が優れた結果になっています。

澤田氏：そうです。Bifrostであればフルコアを使って検証が出来るだろうと考えていましたが、試した結果、CPU検証用に向かないエフェクトがあることも分かりました。恐らくコア数が多すぎて、プログラムがうまく走らなかったのだろうと思います。開発チームが64コアモデルを対象として開発・デバッグを行ったかどうかは分かりませんが、今のところはバグに近い挙動だと思っています。一応、公式フォーラムには情報を上げておきました。

CGW：そういった状況を加味しなければ、この結果も適正な値と言えます。ただ、Arnoldでのレンダリングよりは差が縮まった印象があります。

澤田氏：メモリとのやり取りがレンダリングよりも頻繁にあるのと、エフェクト生成のキャッシュデータをネットワーク経由でNASに保存しているためです。内蔵ストレージであれば結果はもう少し違っていたかも知れませんが、エフェクトをやろうとすると内蔵SSDが4TBか8TBほど必要になりますので、今回は検証していません。

CGW：3つの検証とはフレーム数が異なるテストシーンDについても教えてください。

澤田氏：Death Building（テストシーンD）はもう少し時間を掛けて燃焼シミュレーションを進めたもので、150F分をレンダリングしています。エフェクト尺によって処理性能に差が出るかを検証するために行いましたが、結果としては9900Kが10時間2分、5950Xが5時間10分、3995WXが2時間28分となり、AMD同士では約2倍の速度となり、30F分のレンダリング時と比率に大きな差異は見られませんでした。

Bifrostでのエフェクト検証とシミュレーション時間比較

CGW：続いて、Material Point Method (以下、MPM)での検証結果を教えてください。

澤田氏：MPMはリキッドやパーティクルと異なり、質量をもった粒子を連続的に扱うシミュレーションとなります。2種類の映像を検証しています。

澤田氏：Simulation Aでは9900Kが46分47秒、5950Xが33分38秒、3995WXが25分42秒となっています。不思議なのは、IntelとAMDによる性能差は見えるものの、AMD同士ではあまり大きな差異が現れなかったところです。CPU使用率を確認しても100%になっておらず、一番悪い時では半分ほどのコアが休んでいる状態になっていました。おそらくこれは、現時点ではMPMの仕様です。Arnoldのようにメニーコアを扱えるレンダラもあれば、特定のコアを使ったあとに別のコアを使うという挙動のレンダラもありますが、この検証ではコアがうまく扱えていませんでした。

MPM (Material Point Method)でのシミューレション

澤田氏：続いてSimulation Bは、管の中を質量を持った物体が通り抜けるというもので、一般的なパーティクルではできないMPM特有の作例となります。これも9900Kが4分18秒、5950Xが2分39秒、3995WXが1分45秒と、実測値は2倍にも至りませんでした。

MPM (Material Point Method)でのシミューレション

澤田氏：続いてCurve Influence Simulation Aの検証です。描いたカーブに沿って影響を与える性質があり、こちらも一般的なパーティクルとは異なるものです。ただ、こちらも結果としては9900Kが4分43秒、5950Xが2分40秒、3995WXが1分54秒と、コア数ほどの有意差は示されませんでした。ただ、8コアと16コアは倍近い差となっているため、16コアまでであれば想定内の結果でした。憶測ですが、ボリュームゾーンとしての16コアまでを対象に開発が進められているのかも知れません。

Curve Influenceでのシミューレション

澤田氏：複合技として、カーブに沿ってAero Simulationを行ったCurve Influence Simulation Bも時間を測定しました。ねじれるような炎の燃え方を表現しています。なぜかこれは3995WXが倍近いパフォーマンスになっていて、恐らくAの方が複雑でBの方がシンプル（発生した粒子数が少ない）のが理由かも知れません。

Curve Influenceでのシミューレション

CGW：Bifrostでの検証結果をまとめると、Aero Simulationでは2倍程度のパフォーマンスを発揮するが、MPMやCurve Influence Simulationでは大きな差がつかなかったということですね。

澤田氏：そうなります。ヘヴィな処理を必要とするMPMは思ったよりパフォーマンスが上がりませんでした。Aero SimulationではCPU使用率が100％近かったのに対し、それ以外は70-80%でしたので、特殊なシミュレーションではまだ真価を発揮できていない可能性があります。

CGW：各プラグインのメニーコア対応や最適化が進めば、状況は一変しそうですね。続いてFoundry社 Nukeでの検証について伺いたいと思いますが、こちらはどういった検証を行いましたか？

澤田氏：NukeはCPUオンリーのソフトウェアではないので、業務で用いたノードを使ったときの所感などを述べていきます。これは7K映像を出力した際のものです。CPU処理のノードか、GPU処理のノードか、それぞれを切り分けて測定することも可能ですが、仕事でNukeを使う上ではそこで線引きをあまりしないので、あくまで実務的な範囲での使用感をお話します。

Nukeコンポジット作業時のCPU使用率と各コアの稼働状況

澤田氏：デフォルトではCPUはほぼ使われておらず、ディスク書き込みやネットワーク通信がほぼ全てです。64コアあっても、標準状態ではまったく使ってくれません。そこで、プリファレンスの中のリミット解除（※）を行います。
※Nukeのデフォルト設定ではframe sever process to runでCPU使用制限が掛けられているが、リミットを解除すれば99スレッドまで対応させることが可能

Nukeコンポジット作業時のCPU使用率と各コアの稼働状況

CGW：リミット解除を行った場合、メニーコアは充分に活用されましたか？

澤田氏：かなり使ってくれていますね。ストレージ、ネットワークの影響はもちろんありますが、CPU処理に関しては非常に速くなりました。16コアをお使いのユーザーも、この設定をすれば性能自体は上がるはずです。ただ、この機能はあくまで最終レンダリングのフレームサーバーとして用いる時だけです。その意味では書き出しは、体感ベースですが1時間程度のものが15分ほどになるなど、4倍ほどの性能差は感じられました。

CGW：続いてはGPUについてお伺いします。検証機はNVIDIA RTX A6000を搭載しています。従来のQuadro RTXシリーズに置き換わる形で登場した、NVIDIAの中で最も高いスペックになります。比較対象となるのは、RTX 4000とQuadro P2200で、いずれも従来用いられていた業務用GPUとなりますが、レンダリング時間の実測などはどのような結果になりましたでしょうか。

ArnoldでのGPUレンダリング検証

澤田氏：優れたCPUを搭載するPCは、GPUも性能が高いものが搭載されているので、その意味では「この結果は、どっちがどう作用しているのか？」というのが分からなくなる場合もあります。今回は、CPU/GPU両対応のArnoldでレンダリングを行いました。シーンは冒頭のものと同じで、設定を変えているだけです。

澤田氏：結果はRTX A6000が2分2秒。RTX 4000が5分46秒、Quadro P2200が11分32秒となりました。A6000はやはり非常に高速です。ちなみに3995WX（CPUレンダリング）では4分15秒でしたので、RTX A6000以外はCPUに負けてしまいました。P2200はそもそもVRAMが足りていないので、もう少しシンプルなシーンであれば健闘するかも知れませんが、この規模のシーンであれば性能を発揮できていません。

CGW：普段の業務では、CPU/GPUどちらでレンダリングを行なっていますか？

澤田氏：普段はCPUレンダリングが多いですね。個人として制作をするときはGPUレンダリングを行うときもありますが、会社では採用していません。ただ、こういうモンスターマシンの場合は事情が変わりますね。GPUレンダリングの場合、シーンのサイズやポリゴン数、テクスチャ数に制限が掛かりますので、最初からそういう設計にしないと難しいと思います。自由にやっていいならCPUレンダリングが優位で、シンプルなシーンならGPUレンダリング優位だと考えています。

CGW：続いてOpenVDBの検証結果をお願いします。OpenVDBを検証に選定した理由をお聞かせください。

澤田氏：2021年初頭にNVIDIAのオンラインカンファレンスでOpenVDBデータの表示が早くなるNanoVDBというライブラリが発表されました。この機能を逸早く搭載したのがこのArnoldの最新バージョンです。メモリーの使用量を低減し、レンダリングを高速化します。機能の一つにNVIDIAの技術が活かされているイメージです。新しい技術ですね。

澤田氏：この中央で渦巻いているのがOpenVDBデータで、容量としては500GBほどあります。ネットワークストレージ越しのため、読み込み時間はその分掛かっていますので、純粋なレンダリングの負荷だけではありませんが、1フレーム分のVDBデータを読み込んだ際の結果を測定しました。なお、こちらはMaya 2022 MtoA 4.2.2で検証しています。まず、NanoVDB対応ドライバを適用したRTX A6000では1分26秒、従来のOpenVDBでは3分30秒でした。RTX 4000+NanoVDBでは4分4秒、Quadro P2200+NanoVDBではVRAM不足で10分2秒という結果になりました。ちなみに、3995WXの場合は1分50秒でした。

Open VDBでのGPUレンダリング検証

CGW：RTX A6000においてNanoVDBは正常に動作しているように感じます。ただ、この結果は、NanoVDB適用かどうかを問わずAMD 3995Xの性能が良く見えます。

澤田氏：そういうことです。CPUでOpenVDBを処理させてもコア数が多いため、1分台と非常に高速でした。これ1個あれば何にでも対応できるのではないか、と感じましたね。

CGW：詳しい検証ありがとうございました。最後に、廃熱周りについてコメントを頂ければと思います。パーツの性能も重要ですが、温度によって性能差がどの程度出るかなどを教えてください。

澤田氏：念のため、PCを密閉した状態とオープンにした状態でArnoldレンダリングを試してみました。CPUの温度にはかなり差が表れています。密閉時は平均81.5度、解放時は平均71.7度と10度ほど差があり、その分熱処理の関係で動作周波数も向上し、レンダリング結果にも明らかな差が生まれています。対してGPUは密閉時は85度で解放時は84度と僅かな差しかありませんでした。動作周波数やパフォーマンスも差は小さくなっています。これは空冷CPUクーラーが筐体内部に排熱する方式であるのと違い、RTX A6000は外排気方式のブロアーファンを搭載しているためと思われます。

PCケースの密閉時と開放時の温度比較
計測時　部屋気温　26.6度
密閉時　平均 81.5度　CPU 最大動作周波数 2.769GHz　レンダリング時間　4分26秒
解放時　平均 71.7度　CPU 最大動作周波数 2.894GHz　レンダリング時間　4分15秒

PCケースの密閉時と開放時の温度比較
計測時　部屋気温　26.6度
密閉時　平均 85度　GPU 最大動作周波数 1.860GHz　レンダリング時間　2分5秒
解放時　平均 84度　GPU 最大動作周波数 1.905GHz　レンダリング時間　2分1秒

CGW：しっかりデータとして見えてきていますね。検証機はこれだけのスペックに対して筐体がコンパクトなことも魅力ですが、特にGPU検証時は開放してもほとんど差異がないほどエアフローがしっかりとしているという印象です。

澤田氏：空調や動作環境を整備してエアフローがさらに確保できればパフォーマンスはさらに安定するのではないかと思います。ここまでのスペックであれば24時間フル稼働して欲しいし、酷使した時に壊れて欲しくない。安定性までは今回は検証できませんでしたが、この部分はこれからに期待したいです。

CGW：総論として、アプリケーション自体に現バージョンではメニーコアを活かしきれないものがあったり、動作環境に依存したりはあるものの、64コアのThreadripper PROとRTX A6000を搭載した今回の「ThinkStation P620」は従来機に無いポテンシャルを感じさせてくれる一台と言えそうですね。ありがとうございました。

INFORMATION

株式会社コロッサスは創業以来、CGをただの技術としてではなくエンタテインメントの中でどう表現に結び付けていくのかを常に模索し続けております。技術や表現が目まぐるしく進化している現在において、私たちも常に進化をつづけ映像のプロ集団としてみなさまの「これを求めていた！」に応えるべく日々精進していきます。現在、プロジェクト多数につき、新卒・経験者ともに積極募集中です。一緒に切磋琢磨しながら、楽しんで作品を作りあげましょう！

cls-studio.co.jp

製品情報

ThinkStation P620

■AMD Threadripper PRO 3995WX (2.7GHz, 32MB)
■NVIDIA Quadro RTX A6000

www.lenovo.com/jp/ja/workstations/thinkstation-p-series/ThinkStation-P620/p/33TS3TPP620

問い合わせ

レノボ・ジャパン株式会社
〒101-0021 東京都千代田区外神田四丁目14番1号秋葉原UDX
http://www.lenovojp.com/business/

法人のお客様向け見積依頼
ご購入相談窓口▶0120-68-6200
direct01_01jp@lenovo.com
受付時間：月曜日から金曜日9時から17時30分
（祝日および年末年始休業日を除く）