>   >  64コア128スレッドのAMD 3995WX & NVIDIA史上最もハイスペックなRTX A6000を搭載したモンスターマシン「Lenovo ThinkStation P620」をコロッサス澤田氏が徹底検証!
64コア128スレッドのAMD 3995WX & NVIDIA史上最もハイスペックなRTX A6000を搭載したモンスターマシン「Lenovo ThinkStation P620」をコロッサス澤田氏が徹底検証!

64コア128スレッドのAMD 3995WX & NVIDIA史上最もハイスペックなRTX A6000を搭載したモンスターマシン「Lenovo ThinkStation P620」をコロッサス澤田氏が徹底検証!

[PR]

Lenovoが展開するワークステーションThinkStaionシリーズの中でも、3DCG制作やVR、データサイエンスに向けたハイエンドモデルとなる「P620」。今回はAMD 3995WX、RTX A6000という構成の検証機を、株式会社コロッサス レンダリングスペシャリストの澤田氏に多角的視点から検証して頂いた。

TEXT_神山大輝/ Daiki Kamiyama(NINE GATES STUDIO
PHOTO_弘田 充/Mitsuru Hirota
INTERVIEW_阿部祐司/Yuji Abe(CGWORLD)

INFORMATION

澤田氏が検証内容を取りまとめたPDFを、Lenovo制作環境調査アンケート回答者に配布します!本アンケートの結果はクリエイター向け製品開発の参考にさせていただきます。
<<<アンケートはこちら>>>

業界最高水準のスペックで検証

CGWORLD(以下、CGW):まずは自己紹介をお願いします。

澤田氏(以下、澤田氏):コロッサスの澤田と申します。弊社は映像制作会社で、ゲーム関係の映像やキャラクターアセットなどを制作したり、映像案件や遊技機などの制作に携わっています。また、本業とは別に専門学校の講師業もやっています。一昨年まではセミナーや講演の仕事も多く、Autodeskさんの記事などを執筆する機会もありました。今日お話することも、恐らく日本の中ではWebサイト含めて正確な情報が手に入りにくい内容についても触れていますので、是非楽しんでいってください。

  • 澤田友明氏/Tomoaki Sawada(コロッサス) 株式会社コロッサス シニアデザイナー。広告業界やB2B関係のCG制作で長年R&Dを担当。グローバルイルミネーションレンダラについても初期段階から様々な検証を行なってきた。現在は同社でCGディレクションやR&Dを担当している。趣味はカメラで富士フィルムを愛用。自宅ではAMD製CPUを搭載した自作PCを愛用している。

CGWORLD(以下、CGW):ありがとうございます。さっそく検証結果を拝見したいのですが、まずは今回の検証機と、比較対象となったご自身のPCのスペックをご紹介ください。

澤田氏:今回は最高水準のスペックで検証をさせて頂いたので、結果としても興味深いものになりました。Intel Core i9-9900K、AMD Ryzen 9 5950Xは一般層向けのハイスペック機種、64core/128ThreadのAMD Ryzen Threadripper PRO 3995WXは現状では単体で最高の性能だと思います。まずはCPUを酷使できる内容として、検証はAutodesk ArnoldによるCPUレンダリングの速度測定を行いました。結果はIntel 9900K(8core/16Thread)が25分16秒、AMD 5950X(16core/32Thread)が12分23秒、AMD 3995WX(64core/128Thread)が4分15秒となりました。コア数だけで見れば4倍になりますが、コア数が増えた分、熱処理の問題で動作周波数が落ちたり、アーキテクチャー世代の違い、メモリーやネットワーク通信などの処理がボトルネックになる場合もあるため、処理速度は単純に4倍になるわけではありません。

ArnoldでのCPUレンダリング検証

CGW:コア数に比例しておよそ3倍の速度と、想定通りの結果に近いと思います。

澤田氏:CPU使用率は100%近辺でしたし、概ね3倍の性能差は想定内でした。ArnoldでのCPUレンダリングは素直に性能が出るテストなので、コストパフォーマンスを考えるのであればAMD 5950Xや3995WXは選択肢としては良いと思っています。また64コアの並列処理能力が1ソケットのコンパクト筐体に収まっている今回の検証機は、現場では単なるレンダリング処理時間の向上にとどまらない価値があるかもしれません。

CGW:続いてBifrostによるシミュレーションの検証をしていただきました。

澤田氏:BifrostはAutodesk Maya 2018から標準搭載されたノードベースのエフェクトツールです。従来はHoudiniでやっていたような作業をMaya上で実現可能にしたプラグインで、個人的にはSoftimageの系譜がここに生きている感覚がありますね。特徴としてはMayaのアニメーションに直接エフェクトシミュレーションを合わせることができるという点と、シェーダーやライトの影響が正確にビューポート表示できるというところです。Bifrostでは、3つのテストシーンで30Fレンダリングを行い、速度測定を行いました。画像はいずれも左側がプレビュー、右側がノードグラフになります。

Bifrostでのエフェクト検証

Bifrostでのエフェクト検証とシミュレーション時間比較

澤田氏:AeroExplosion(テストシーンA)は、炎が燃えあがるエフェクトです。9900Kが2分01秒、5950Xが1分14秒、3995WXが37秒という結果になりました。AeroSmoke(テストシーンB)は9900Kが40秒、5950Xが27秒、3995WXが32秒となっています。テストシーンCは爆発系のエフェクトで、これは9900Kが2分58秒、5950Xが1分43秒、3995WXが56秒となりました。この結果から、ひとつだけおかしな点が見えますね。

CGW:シーンBの検証結果ですね。AeroSmokeだけは3995WXが思いのほか時間が掛かっていて、AMD同士で比較するとコア数の少ない5950Xの方が優れた結果になっています。

澤田氏:そうです。Bifrostであればフルコアを使って検証が出来るだろうと考えていましたが、試した結果、CPU検証用に向かないエフェクトがあることも分かりました。恐らくコア数が多すぎて、プログラムがうまく走らなかったのだろうと思います。開発チームが64コアモデルを対象として開発・デバッグを行ったかどうかは分かりませんが、今のところはバグに近い挙動だと思っています。一応、公式フォーラムには情報を上げておきました。

CGW:そういった状況を加味しなければ、この結果も適正な値と言えます。ただ、Arnoldでのレンダリングよりは差が縮まった印象があります。

澤田氏:メモリとのやり取りがレンダリングよりも頻繁にあるのと、エフェクト生成のキャッシュデータをネットワーク経由でNASに保存しているためです。内蔵ストレージであれば結果はもう少し違っていたかも知れませんが、エフェクトをやろうとすると内蔵SSDが4TBか8TBほど必要になりますので、今回は検証していません。

CGW:3つの検証とはフレーム数が異なるテストシーンDについても教えてください。

澤田氏:Death Building(テストシーンD)はもう少し時間を掛けて燃焼シミュレーションを進めたもので、150F分をレンダリングしています。エフェクト尺によって処理性能に差が出るかを検証するために行いましたが、結果としては9900Kが10時間2分、5950Xが5時間10分、3995WXが2時間28分となり、AMD同士では約2倍の速度となり、30F分のレンダリング時と比率に大きな差異は見られませんでした。

Bifrostでのエフェクト検証とシミュレーション時間比較

CGW:続いて、Material Point Method (以下、MPM)での検証結果を教えてください。

澤田氏:MPMはリキッドやパーティクルと異なり、質量をもった粒子を連続的に扱うシミュレーションとなります。2種類の映像を検証しています。

澤田氏:Simulation Aでは9900Kが46分47秒、5950Xが33分38秒、3995WXが25分42秒となっています。不思議なのは、IntelとAMDによる性能差は見えるものの、AMD同士ではあまり大きな差異が現れなかったところです。CPU使用率を確認しても100%になっておらず、一番悪い時では半分ほどのコアが休んでいる状態になっていました。おそらくこれは、現時点ではMPMの仕様です。Arnoldのようにメニーコアを扱えるレンダラもあれば、特定のコアを使ったあとに別のコアを使うという挙動のレンダラもありますが、この検証ではコアがうまく扱えていませんでした。

MPM (Material Point Method)でのシミューレション

澤田氏:続いてSimulation Bは、管の中を質量を持った物体が通り抜けるというもので、一般的なパーティクルではできないMPM特有の作例となります。これも9900Kが4分18秒、5950Xが2分39秒、3995WXが1分45秒と、実測値は2倍にも至りませんでした。

MPM (Material Point Method)でのシミューレション

澤田氏:続いてCurve Influence Simulation Aの検証です。描いたカーブに沿って影響を与える性質があり、こちらも一般的なパーティクルとは異なるものです。ただ、こちらも結果としては9900Kが4分43秒、5950Xが2分40秒、3995WXが1分54秒と、コア数ほどの有意差は示されませんでした。ただ、8コアと16コアは倍近い差となっているため、16コアまでであれば想定内の結果でした。憶測ですが、ボリュームゾーンとしての16コアまでを対象に開発が進められているのかも知れません。

Curve Influenceでのシミューレション

澤田氏:複合技として、カーブに沿ってAero Simulationを行ったCurve Influence Simulation Bも時間を測定しました。ねじれるような炎の燃え方を表現しています。なぜかこれは3995WXが倍近いパフォーマンスになっていて、恐らくAの方が複雑でBの方がシンプル(発生した粒子数が少ない)のが理由かも知れません。

Curve Influenceでのシミューレション

CGW:Bifrostでの検証結果をまとめると、Aero Simulationでは2倍程度のパフォーマンスを発揮するが、MPMやCurve Influence Simulationでは大きな差がつかなかったということですね。

澤田氏:そうなります。ヘヴィな処理を必要とするMPMは思ったよりパフォーマンスが上がりませんでした。Aero SimulationではCPU使用率が100%近かったのに対し、それ以外は70-80%でしたので、特殊なシミュレーションではまだ真価を発揮できていない可能性があります。

CGW:各プラグインのメニーコア対応や最適化が進めば、状況は一変しそうですね。続いてFoundry社 Nukeでの検証について伺いたいと思いますが、こちらはどういった検証を行いましたか?

澤田氏:NukeはCPUオンリーのソフトウェアではないので、業務で用いたノードを使ったときの所感などを述べていきます。これは7K映像を出力した際のものです。CPU処理のノードか、GPU処理のノードか、それぞれを切り分けて測定することも可能ですが、仕事でNukeを使う上ではそこで線引きをあまりしないので、あくまで実務的な範囲での使用感をお話します。

Nukeコンポジット作業時のCPU使用率と各コアの稼働状況

澤田氏:デフォルトではCPUはほぼ使われておらず、ディスク書き込みやネットワーク通信がほぼ全てです。64コアあっても、標準状態ではまったく使ってくれません。そこで、プリファレンスの中のリミット解除(※)を行います。
※Nukeのデフォルト設定ではframe sever process to runでCPU使用制限が掛けられているが、リミットを解除すれば99スレッドまで対応させることが可能

Nukeコンポジット作業時のCPU使用率と各コアの稼働状況

CGW:リミット解除を行った場合、メニーコアは充分に活用されましたか?

澤田氏:かなり使ってくれていますね。ストレージ、ネットワークの影響はもちろんありますが、CPU処理に関しては非常に速くなりました。16コアをお使いのユーザーも、この設定をすれば性能自体は上がるはずです。ただ、この機能はあくまで最終レンダリングのフレームサーバーとして用いる時だけです。その意味では書き出しは、体感ベースですが1時間程度のものが15分ほどになるなど、4倍ほどの性能差は感じられました。

CGW:続いてはGPUについてお伺いします。検証機はNVIDIA RTX A6000を搭載しています。従来のQuadro RTXシリーズに置き換わる形で登場した、NVIDIAの中で最も高いスペックになります。比較対象となるのは、RTX 4000とQuadro P2200で、いずれも従来用いられていた業務用GPUとなりますが、レンダリング時