[PR]
現在主流のNANDフラッシュを採用したSSDでは、ランダムアクセスの読み書き速度がボトルネックとなっている。それを解決すべく、インテルとマイクロン・テクノロジーが共同開発したのが革新的な不揮発性メモリ技術「3D-Xpoint」だ。3D-Xpointを採用した初のコンシューマ向けSSD「Optane SSD 900P」シリーズの実力にせまる。
スロットに挿すだけで使用できる 確かなワークフローの改善にも
インテルからコンシューマ向けに発売された、次世代の不揮発性メモリ技術「3D-Xpoint」を用いたSSD「Optane SSD 900P」シリーズ。従来のNANDフラッシュが抱えていた「ランダムアクセスに弱い」という弱点を一気に解消した、革新的な製品だ。エンタープライズ向けに活用されていた技術をコンシューマ向けに転用したもので、PCの2.5インチPCIe X4スロットに接続するだけで、誰でも手軽に使用できる。インテル公式の発表によると、Houdiniで作成した11億個のパーティクルで構成された大渦巻きのCGアニメーション(約7秒)のレンダリングを、TLCNANDフラッシュの競合SSDとの比較で約2.75倍も高速化することに成功したという。
インテル® Optane™ SSD900P シリーズ ディスク容量:240GB/480GBフォームファクター:HHHL(CEM3.0)
インターフェイス:PCle NVMe 3.0×4
パフォーマンス:下記図表参照
>>製品の詳細はこちら
現在市販されているのは280GBと480GBの2モデルで、実勢価格は280GBで48,900円、480GBで75,900円。単純な容量あたりの単価では一般的なNANDフラッシュ採用SSDよりも割高な印象を受けるが、日本を代表するHoudiniアーティストとして知られるトランジスタ・スタジオ秋元純一氏は「CG制作のボトルネックを解消する、非常に付加価値の高い製品」だと評価する。今回、秋元氏には検証用PCと共にOptaneSSD 900Pを貸し出し、普段の実作業に即したかたちで一連の検証を行なってもらった。詳細は後述するが、総じて今回の検証機材ではCPUの処理速度がボトルネックになった。特にFLIP流体シミュレーション関連のベンチマーク結果に対して、秋元氏は「確実にパフォーマンスは向上するが、Houdini内部での処理時間がストレージの書き込み速度に追いついていないようだ」と語る。
もっとも、これだけでOptaneの価値が乏しいと考えるのは早計だ。「Houdiniをバリバリと使いこなすようなアーティストは、シミュレーションの実時間よりも、データの読み書きに要する時間をシビアに見ている」(秋元氏)からだ。検証結果でもデータのプレビューをはじめ、リード&ライトに要する時間はOptaneが群を抜いている。プレビューの時間短縮が最終クオリティに直結するのは明らかだろう。
実際、秋元氏はOptaneの導入でHoudiniのシーンファイル保存に要する時間が格段に短縮されたという。HoudiniファイルはASCII形式で構成されているため、ファイルサイズが10MBを超過すると保存に要する時間が細かいストレスになる。しかし、ランダムアクセスに強いOptaneなら、手早く保存できたのだ。ベンチマークの結果だけを見ていてはわからない重要な要素である。
最大のボトルネックは計算ではなく、読み書きの時間
Houdiniのデータフローやプロセスについて図解する秋元氏。Houdiniの内部処理が最適化されれば、Optaneがその真価を発揮できるはずと語っていた
これらの検証結果を下に、CGスタジオはどのようにOptaneの導入を進めれば良いのだろうか。秋元氏は「ローカルPC上でジオメトリキャッシュを取る処理は、単純に高速化できるはず」だと指摘する。「今回の検証機では、Optaneをデータディスクドライブとして検証したが、システムドライブとしてHoudiniアプリケーションを稼働することでも、パフォーマンスの向上が期待できる」という。
また、プレビューを多用する代表例がスーパーバイザーやリードアーティストだ。「スーパーバイザーやリードアーティストといったエースたち向けのモンスターマシンに導入するのが理想ですね。彼らしかなし得ない、最高のクリエイティブワークに専念してもらうためにも、待機時間に要する時間を最小限に抑えたい。そう考える経営者は多いのではないでしょうか」(秋元氏)。
CPUのスペックを3倍に上げても、作業効率が3倍に向上するとは限らない。それよりもOptaneを導入する方がはるかに確実で、投資コストも手頃......秋元氏はこのように説明する。「今回の検証でCG制作はボトルネックとの戦いであることを、改めて実感しました。SSDの相場観ではなく、デジタルコンテンツ制作全体に関する投資コストで判断するべきだと思います」(秋元氏)。
秋元氏の提案はワーフクロー全体にもおよぶ。従来はHDDをRAID環境で組むことでアクセス速度の向上を図る例が一般的で、SSDでRAID環境を組む構成も見られた。これに対してOptaneはスロットに差すだけで、特別な設定を必要とせずに使用でき、安定性も高い。「そのため、サーバのメモリに入れていく感覚で活用する方法も考えられます。ネットワークと書き込みに要する時間の短縮化が期待できます」(秋元氏)。
また、Houdiniのバッチライセンスを取得しているスタジオであれば、NAS的な使い方も有効ではないかという。「Deadlineなどのディスパッチャーを併用することで、1次キャッシュはOptane、本番キャッシュはHDDといった使い方が期待できます」(秋元氏)。OptaneとHDDのデータ受け渡しをスクリプトで行い、Optaneを最大480GBのRAMを搭載している感覚で使用するわけだ。
「Houdini Batchのライセンス費用は年間契約で5ライセンス50万円と、安くはありません。その一方、大半のCGプロダクションではバッチライセンスの稼動率は、それほど高くないのではないでしょうか。Optaneを社内サーバ上に組み込むことで、稼動率の向上が期待されます」(秋元氏)。こうした提案ができるのも、メモリのアクセス速度に迫る、Optaneの高いランダムアクセス性能ゆえだと言える。
秋元氏はこれらの提案をまきとるかたちで、「こうしたワークフローの改善を行うことなく、作業マシンのスロットに差すだけで、すぐに導入できる点もOptaneの魅力ですね」と語った。HoudiniをWindows環境で、誰でもサクサクと使えるようになる可能性を秘めているというわけだ。日本のCG制作環境で、今後Houdiniの活用が拡大する中、マシンの足回りを固める重要な製品のひとつだと言えよう。
リード&ライトに確かなパフォーマンスを実感
今回、秋元氏には流体シミュレーションから高解像度モデルのレンダリングまで、全6項目にわたって実践的な検証を行なってもらった。HDD、NANDメモリ採用SSD、そしてOptaneのベンチマーク結果を紹介する。以下は検証に用いた機材のスペックだ。
-
● OS:Windows 10 Home 64bit
● CPU:Intel Core-i7 7800X 3.5GHz
● RAM:32GB
● GPU:NVIDIA Quadro P4000
● SSD:SanDisk SDSSDA480G
● HDD:Western Digital WD30EZRZ
検証1
FLIPによる流体シミュレーション
CPUの演算速度が読み書き速度に及ばず差がつかなかった?
Houdini 16.5でFLIP Tankを用いたシミュレーションを実施。内臓HDD、一般的なSSD、Optaneの3種類で所要時間を比較してみた。Tankの中には500万パーティクルのデータが存在し、それに対して各フレームのキャッシュが約140MBの流体シミュレーションを計100フレーム分、行なっている。大量のランダムアクセスが生じるため、大きな差異が出るのではと期待されたが、結果的には大差は見られなかった。「CPUの演算速度が各々のストレージの書き込み速度に及ばず、タイムラグが発生しなかったのではないでしょうか」(秋元氏)。一般的にCPU内部での演算とストレージへの書き込みは並行して行われる。時間がかかる演算処理の背後で、瞬時に書き込みが終了してしまえば、ストレージの性能差は関係なくなる。「データが軽ければ、シミュレーションの演算も早く終わるので、結果に差が出るのかもしれません」(秋元氏)
検証2
流体Sim結果に応じたメッシュの貼り込み
確かな性能差を確認するも潜在能力は引き出しきれていない?
続いて、検証<1>で得られたシミュレーション結果に対して、合計40万ポリゴン分のメッシュを貼ってみた。その上でメッシュの読み込み時間も計測。前者はHDDに対してSSDでは91%、Optaneで88%の時間減少に留まったが、後者ではSSDで65%、Optaneでは56%減少と、大きく向上した。「書き込み速度については検証<1>と同じで、Houdini内のCooking処理に対してストレージの書き込み速度が速すぎるため、処理時間に差が出なかったのだと思います」(秋元氏)。もっとも検証<1>より扱うデータ量が減少しているため、その分だけCPUの演算負荷が下がり、結果に差が出た。「後者では、単純にデータのプレビューを行なっているだけなので、ストレージごとの差がはっきりと出たのでしょう」(秋元氏)。なお、一般的なSSDとOptaneであまり差が出なかったのは、HoudiniのファイルI/Oの影響かもしれないという。
検証3
200万ポリゴンのメッシュ書き出し&読み込み
読み込み時間では性能差がダイレクトに表れた
Houdiniから各ストレージに対して、200万ポリゴンのメッシュを書き出す時間と、プレビューで読み込む時間の差異を計測。検証<1>、<2>と同様に、書き出し時間ではHDDに対してSSDではほぼ同じ。Optaneでは88%減少となっている。これに対して読み込み時間ではSSDで86%、Optaneでは54%の時間減少を確認。「書き込みにはHoudiniのノードを使いますが、こちらもI/Oの速度にボトルネックがあるため、理論値が出なかったものと推察されます」(秋元氏)。一方、読み込み時間ではCPU内での処理を必要としないため、純粋にストレージの性能が反映されたようだ。「今回プレビューしたのは100フレーム分の動画データ(シーケンシャルデータ)です。大小様々なデータを用いてプレビューするなど、ランダムアクセスが必要なデータで比較すれば、よりOptaneの特性が発揮されるかもしれません」(秋元氏)
検証4
3億ポイントのキャッシュ書き出し&読み込み
巨大なデータを扱うほど確かな恩恵が得られることを確認
これまでの検証で、CPUの演算速度とHoudiniのファイルI/Oが書き込み速度に影響を与えること。その一方で読み込み速度はストレージごとの性能差が出やすい傾向がわかってきた。「そこでHoudiniの作業負荷をものすごく高めてやろうと、3億ポイントのキャッシュデータを使用し、書き出し・読み込み速度を比較してみました」(秋元氏)。総フレーム数は同じでも、1フレームあたりのファイル容量が検証<3>では27MBだったのに対して、こちらは2.4GBと約88倍だ。結果は書き込み速度で、HDDと比較してSSDでは76%減少、Optaneでは32%減少。読み込み速度ではSSDで40%減少、Optaneでは14%減少となった。「大規模データほどOptaneの真価が発揮されました。特に読み込み速度ではプレビューにかかる時間が約20分から約3分へと大幅に減少、この差は非常に大きいです」(秋元氏)
検証5
フルHD、そして8Kサイズのコンポジットワーク
2Kよりも8Kの方が差が出たもののOptaneの真価を引き出すにはいたらず
流体シミュレーション・ポリゴンメッシュ・パーティクルと、Houdiniで扱う主要なデータ形式で検証を行なってきた。それではHoudiniにおけるコンポジット作業ではどのような違いが出るのか。ここでは32Bit形式のOpenEXRファイルを用意し、データをストレージから読み込んでHoudiniでレンダリング。さらにそれを元のストレージに書き出す時間を計測した(コンポジットサイズは2Kと8K)。結果的には検証<1>と同じで、ストレージ間での差がほとんど見られなかった。HDDとOptaneの比較でも、2Kコンポジット時では99%、8Kでは98%と、データが大容量になるほど速度が向上する傾向がうかがえるが、僅差に留まっている。「いずれも読み込みと書き込みに要するCPU内部での演算処理、そしてHoudiniのファイルI/OがOptaneの処理速度に追いついていないことに起因すると考えられます」(秋元氏)
検証6
メインキャラクターを想定した大容量レンダリング
現時点ではCPUを介さない処理ほどストレージの性能差を実感できる
最後にメインキャラクターを想定した大容量レンダリングを試した。2,000万ポリゴンのモデルデータに対して、16bitのTIFFデータによる4Kテクスチャを153枚読み込み、レンダリング。非常にリッチな条件にも感じられるが、「最近の映画案件では標準的なデータサイズ」(秋元氏)なのだとか。結果はこれまでの検証と同様で、HDDに対してSSDでは作業時間が98%減少、Optaneでも97%減少に留まった。「若干の速度差が出ているのは、テクスチャの読み込み時間と中間ファイルの書き込み時間が影響しているからで、実際はほとんどがレンダリングに要する時間だと考えられます。そのため検証<1>と同様に、CPUで演算処理をしている背後でストレージの読み書きが終了してしまい、差が出にくいのかも」(秋元氏)。現段階では、大容量データのチェック用途などCPUを介さない作業でOptaneの恩恵をより大きく得られるようだ。
今回の検証と取材で明らかになったことは、「OptaneがPCの総合バランスを崩すほどの実力を秘めた、最強のストレージ」であるということだ。しばしばPCはF1マシンに喩えられる。エンジンだけを強化しても、シャーシとの相性やタイヤ、サスペンションなどの改善が伴わなければ、真価を発揮し得ない。Optaneもまた同様というわけだ。ただし、圧倒的なアクセス速度が対応スロットに差すだけで、手軽に得られるのも事実。その一方でCPUやGPUといったパーツ類も、日進月歩でスペックアップしていく。あとは各スタジオが自社の業務内容にあわせて、最適なタイミングで導入を決めれば良いというわけだ。その上で秋元氏への取材でも示された通り、まずはスーパーバイザーやアートディレクターといった、エース級の人材に向けたモンスターマシンから導入を進めながら、社内全体のワークフローの改善へと進めていくのが王道の使い方だろう。いみじくも秋元氏が明らかにしたように、CG制作はボトルネックとの戦いだ。PCの総合バランスを崩すほどの高速ストレージが、ワークフロー全体のボトルネックを改善させる。これがOptaneの最もユニークな点ではないだろうか。
問:インテル株式会社
www.intel.co.jp
TEXT_小野憲史
PHOTO_弘田 充