2023/12/13 PR

クリエイターのワークステーション選びを再考する！ Maya、Blender、Substanceなどガチ検証！（Lenovo イベントレポート）

　2023年9月26日、レノボ・ジャパン合同会社は東京都千代田区の本社ビルで「メディア＆エンターテイメント業界におけるワークステーションの活用」と題したセミナーを実施し、クリエイター向けワークステーションのパフォーマンス評価や、同社製ワークステーションの強みを解説した。

　まず、レノボ・ジャパンワークステーション＆クライアントAI事業部事業部長の小林直樹氏の開会挨拶に続いて株式会社コロッサスのシニアデザイナー、澤田友明氏が登壇し、CG映像制作におけるCPUとGPUのパフォーマンスについて講演した。パフォーマンスを測るにはベンチマークソフトを用いるのが一般的だが、実際の作業現場では使用するアプリケーションやバージョンの違いもあり、必ずしも実環境でのパフォーマンスを測れるとは限らない。そこで、澤田氏はレノボ・ジャパンのワークステーションを利用して、同社が普段利用しているソフト環境を使ったパフォーマンス比較を実施。より実践的なテストを行なった。

記事の目次

ソフト側の最適化で大きく変わるCPUとGPUのパフォーマンス

澤田友明氏

株式会社コロッサスレンダリングスペシャリスト。CG黎明期の頃からソフト及びハードのR&Dに携わり、STAR WARSシリーズをはじめ様々なエンターテイメント映像制作に従事。主にレンダリング関連の造詣を深め各種セミナーや専門学校の講師を務める。エンターテイメント以外でも8Kによる重要文化財3Dアーカイブ制作をNHKと共同で行なっている。最近ではCGWORLDの記事執筆やアドバイザリーボードの一員として主にハードウェア関連の情報をCG業界に発信。

　使用したワークステーションは3台。レノボ・ジャパンのワークステーションは注文時のカスタマイズに対応しており、以下の構成は今回のテストで使用したものとなる。

　1台目は「Lenovo ThinkStation PX」。CPUに32コア／64スレッドのインテル Xeon Gold 6430 プロセッサー（以下、Xeon Gold 6430）を2個、GPUにNVIDIA RTX 6000 Ada世代（以下、RTX 6000 Ada）を搭載したハイエンドモデルだ。2台目は「Lenovo ThinkStation P3 Tower」。CPUに16コア／24スレッドのインテル Core i7-13700K プロセッサー（以下、Core i7-13700K）、GPUにNVIDIA GeForce RTX 4080（以下、GeForce RTX 4080）とコンシューマー向けのパーツを採用したモデルとなる。

　3台目は澤田氏が普段利用しているBTO PCで、CPUは16コア／32スレッドのAMD Ryzen 9 5950X プロセッサー（以下、Ryzen 9 5950X）、GPUはNVIDIA RTX A5500（以下、RTX A5500）という組み合わせだ。このPCはCPUが1世代前のため、そのぶん少し不利となる。

　テストでは Maya や Blender などを使った一般的な作業で比較した。素直に考えれば全てのテストで最新、ハイエンドの「Lenovo ThinkStation PX」が圧勝すると予想するだろうが、澤田氏自身が「意外な結果になった」と語ったように、そう単純な話にはならないようだ。

Mayaでの検証

Maya Arnold Render　CPUレンダリング

　MayaのArnoldレンダラのレンダリングをCPUで実行したテストでは「Lenovo ThinkStation PX」の圧勝。全てのCPUコアをほぼ100%使っているため、合計64コア／128スレッドというXeon Gold 6430のスペックがそのまま生きた形だ。

　一方、「Lenovo ThinkStation P3 Tower」のCore i7-13700KはRyzen 9 5950Xよりも少し遅いという結果に。Core i7-13700Kの属する第13世代インテル Core プロセッサーシリーズはCPUコアに性能重視の高性能な「Pコア」と処理効率（省電力）重視の高効率な「Eコア」を搭載しており、スペックにあるコア数がそのまま高性能なコアの数ではないという特徴がある。また発熱によるクロック周波数の低下が大きい。そのため1世代前とはいえ全てのコアが高性能コアのRyzen 9 5950Xの方が高いパフォーマンスを示したようだ。

MayaのArnoldレンダラを使ったCPUレンダリングでは、Xeon Gold 6430×2のコア数が効いて「Lenovo ThinkStation PX」が他を圧倒した。

Maya Arnold Render　GPUレンダリング

　GPUを使ったテストでも、CPUと同様にテストによって結果が上下することとなった。注目点はコンシューマー向けGPUとなる「Lenovo ThinkStation P3 Tower」のGeForce RTX 4080がNVIDIA RTXシリーズとどこまで張り合えるのかだ。GeForce RTX 4080とRTX 6000 Adaは共に「NVIDIA Ada Lovelace アーキテクチャー」を採用している。RTX A5500は「NVIDIA Ampere アーキテクチャー」で、1世代前となる。

　ArnoldのレンダリングをGPUで実行したテストでは、「Lenovo ThinkStation PX」が1位、「Lenovo ThinkStation P3 Tower」が2位、RTX A5500が3位となった。エンタープライズ向けのRTX A5500がコンシューマー向けのGeForce RTX 4080に負けてしまうのは、世代間のパフォーマンス差の大きさがうかがえる。

Arnoldレンダラを利用したGPUレンダリングの比較。Global Light SamplingをONにした状態ではCPUと同じく倍以上速くなった。GPUの世代の影響が大きく、GeForce RTX 4080がRTX 6000 Adaに近いパフォーマンスを発揮している。

Maya Bifrost　CPUシミュレーション

　同じくMayaのBifrost（ver 2.5.1）を使ったCPUによる燃焼シミュレーションで最も速かったのは、今度は「Lenovo ThinkStation P3 Tower」。「Lenovo ThinkStation PX」は最も遅いという結果になった。

澤田氏はこの結果について「Bifrostが64コア／128スレッドを使い切れていないため」と分析した。Xeon Gold 6430はコア数が多いぶんクロック周波数が低いという特性があるため、コア数のメリットが活かせないとパフォーマンスが落ちてしまうということだ。反対に、このテストではCore i7-13700Kが高いクロック周波数を維持できたため良い結果につながったという。

テストシーンB　AeroSmoke
テストシーンC　AeroRolling

MayaのBifrostを使った燃焼シミュレーションでは、反対に「Lenovo ThinkStation PX」の所要時間が長かった。Xeon Gold 6430のクロック周波数の低さがネックになったようだ。

Maya OpenVDB

Maya ViewPort 2.0

作成したシーンをViewPort 2.0で動かしたテストではGeForce RTX 4080とRTX A5500の立ち位置が逆転した。シェーディングとアンチエイリアスを有効にするとGeForce RTX 4080が優位なものの、他の条件ではRTX A5500の方が高いフレームレートで動作した。

Maya2024.1
ViewPort 2.0で1億2780万ポリゴンものシーンを表示させ、アニメーションを再生しそのフレームレートを計測。ビューポート上でフレーム上限値を決めずに再生させた場合、GPUの持つポテンシャルをフルに発揮できる

※案件に基づくデータのため画面は非公開

「このビューポートテストの結果はOpenGLに最適化されているAシリーズとAdaシリーズの圧勝となりました。ただ、シェーディング時のアンチエイリアスだけはDLSS3を搭載しているRTX4080も健闘しています。Mayaにおけるアニメーション再生時の負荷を減らすためにはAもしくはAdaシリーズの方が向いていると言えます。」（澤田氏）

Blenderでの検証

Blender 3.6 を使用 Blenderのシステム設定ではGPUレンダリングのエンジンを細かく設定する必要がある。 NvidiaのGPUを使用する場合はCUDAとOptiXを選ぶことが可能。テストシーンはBlenderサンプルデータのbarbershop_interior

Blender Cyclesを使ったテストでは、CPUの場合は何と言ってもXeon Gold 6430のスケーラブルプロセッサーの計算能力が発揮された結果になった。一方でCyclesの場合は4080の方が速く、レンダラーの最適化が進んでいないのかもしれないとのこと

Adobe Substance 3D Sampler、RealityCaptureでの検証

　「Substance 3D Sampler」（Adobe）と「RealityCapture」（Epic Games）を利用したフォトグラメトリも試した。写真から3Dオブジェクトを自動生成する機能だ。これはCPUとGPUを両方使うテストとなり、「Lenovo ThinkStation P3 Tower」が最も速かった。澤田氏は「こちらもクロック周波数の高さが有利に働いた。RealityCaptureはCPUのマルチコア対応が進んでおり、Substance 3D Samplerと比べると差は小さいが、いずれもXeon Gold 6430ほどのメニーコアには対応できていない」と語った。

　CPUもGPUも、ソフトや処理内容によってパフォーマンスが変化する。今回のテスト結果を受けて、澤田氏は「Xeon Gold 6430はレンダリングでは速いが、それ以外のシミュレーション等はCoe i7の方が速い」と評価した。

RTX 6000 AdaとGeForce RTX 4080の関係も、パフォーマンスそのものはRTX 6000 Adaの方が高いものの、価格差を考慮するとGeForce RTX 4080のコストパフォーマンスは非常に高い。こうした違いを理解することで、より実作業に即したワークステーション選びができるようになる。

「この検証ではコア数ではなく動作周波数の高さが処理性能に影響を与えているようです。マスク作成、ジオメトリ生成までは互角だった弊社既存PCとThinkstationP3ですが、メッシュ作成処理では大きく差がついてしまいました。」（澤田氏）

「RealityCaptureは1.2.2になってから再構築時のマルチコア対応とGPUの使用率が上がってはいるのでSubstance 3D Samplerほどは差がつかなかったが、それでもシングルコア処理が長引くとXeonスケーラブルプロセッサーと言えども一番遅い結果となってしました」（澤田氏）

動作温度

次に、パフォーマンスと発熱の関係を見るため、PCケースが密閉状態でCPU温度の推移やパフォーマンスに変化がみられるかをテストした。ThinkStation PXはCPUが2パッケージ搭載されているのでこれらの計測結果は×２として考えた方が良いだろう。64コア128スレッドというメニーコアシステムだが、コアパッケージにおける消費電力は最大でも160W程度でパフォーマンスの割にはかなり低い。

そのため動作周波数があまり高くなく、瞬間的なパフォーマンスには劣る場合があるが、レンダリングなどで最大パフォーマンスを長時間継続させてもサーマルスロットリングは発生せず、コア温度も70度を上限として極端に上下動することはなかった。これは２つのCPUを搭載し熱密度が高い状態であるにもかかわらず温度が安定しているということは、ThinkStation PXの筐体における特徴的な冷却構造の優秀さが現れていると言える。

テスト環境はMaya2024、MtoA5.3.3.1
計測時　部屋気温　26.5度

内部構造

澤田氏が大きく興味を惹かれたという内部構造。内側を赤く塗られたデザイン性が高い筐体は、前後方向にしか開口部が無く、上下左右に音が漏れる穴が開いていないため机の下に置いて運用してもかなり静かだったという。エアロフローは前方に最大限の面積で設けられたメッシュから外気を取り入れて後方から排出する1方向のみの流れとなっていて、あちこちに穴が開いているコロッサスの標準PCとは騒音のレベルが異なっていたという。

内部を開けてみると、中央列に２つのCPU、上下にビデオカードが最大4枚まで搭載できるというかなり特殊な構造になっている。CPUやGPUの排熱がそれぞれに影響を及ぼすような筐体内を対流してしまうことがない設計だ。つまりCPUレンダリング、GPUレンダリングでも安心して運用できると言える。「GPUカードの入れ替えがドライバーでネジを外すような手間を掛けずとも、前後にあるラッチを動かすだけで簡単に行うことが出来ることに感動した」（澤田氏）。筐体内を彷徨う電源ケーブルもスッキリと収納されていて一見して専用にデザインされていることが分かる

クリエイターは何を基準にハードウェアを選定するのがベストか？

　次にレノボ・ジャパンワークステーション＆クライアントAI事業部シニア・プロダクトマネージャーの高木孝之氏が登壇し、ワークステーションのハードウェア選びについて解説した。

　CPUは使用するソフトや機能によってコア数とクロック周波数のどちらがより有効かが異なる。使用するソフトがどちらの性質を持っているかを調べることが重要となる。また「Hyper-Threadingを無効にする、Eコアを無効にするといった設定で、かえってパフォーマンスが伸びる場合もあるので、こうしたことも試すとよい」（高木氏）と語った。

　メモリーは「容量に余裕を持たせるのは当たり前。注目してほしいのはECC（エラー訂正）機能」（高木氏）と強調した。アンバッファードメモリはエラー訂正機能を有しないか、あってもシングルビットエラーにしか対応していない。そのためエラーが発生すると作業が止まってしまうリスクがある。長い時間のかかるレンダリングが完了手前で止まってしまうと、納期への影響も出かねない。CoreシリーズではECC付きメモリ、XeonシリーズではECCレジスタードメモリが利用できるので、業務で使うのであればこちらを薦めているという。

　GPUに関しては、M&E業界では得てして初期投資の低いGeForce系を一律に採用されているお客様も少なからずである。しかしながら、使用するアプリケーションや機能によって、OpenGL/DirectXのどちらが多用されているか、実際どちらが性能が出るのか検証してみることが重要だと同氏は警鐘を鳴らす。Quadro（現RTX）系はより多くのVRAM容量を搭載し、例えばレンダリングの時短に有利なケースがある。初期投資の大きいQuadro系ではあるが、時短効果が年間どの程度の金額差に換算できるのか試算してみれば十分ペイケースも多々あると言う。

また、NVIDIA以外の多数のサードパーティ各社が、ファンの枚数含め最終製品設計～生産を独自に行っているGeForceに対し、Quadro系は世の中にNVIDIA社製の一製品しか無い。最終製品の設計～生産、品質管理やドライバのバグFIXまで全て本家NVIDIA社が直接管理しているという体制は、業務用途では大きな意味がある。

　同社がワークステーションを設計する際に注力している点として、「堅牢性はもちろん、冷却に並々ならぬ執念を燃やしている」（高木氏）という。冷却設計はパーツを熱から守るというだけに留まらず、効率良く冷却できればノイズの低減にも寄与する。「同じノイズレベルでも、よりストレスを与えにくい音になるよう工夫している」（高木氏）と語った。「Lenovo ThinkStation PX」は2個搭載したCPUの排熱経路を分け、片方のCPUの熱がもう片方のCPUに影響を与えないようにするなど、筐体内部のエアフローにも気を使って設計しているという。

また、Lenovoの得意とする冷却機構をモバイルに落とし込んだモバイルWSや、Lenovoの提供するセキュリティを兼ね備えたリモートデスクトップアプリケーション「TGX Remote Desktop」など、テレワークやワーケーションといった多様な働き方に合わせて柔軟に選択して欲しいとのこと。

　用途に合わせたハードウェア選択で処理の待ち時間を低減し、安定稼働による再処理やダウンタイムを減らすことでプロジェクト全体の時短につなげられる。高木氏は「ハードウェアが止まってもよいというお客様はおられないと思うので、いかに安定稼働を続けられるか、つまり冷却能力がどれだけ優れているかというところもぜひ見てほしい」と語り、講演を締めくくった。

　会場では同社のワークステーションの実機が展示されていた。最後にいくつか紹介しよう。