<3>機械学習型AI向けGPGPU製品「RADEON INSTINCT」シリーズ
VEGAに関連して、AMDは、機械学習(Machine Learning)向けのGPGPU(General Purpose GPU)製品として「RADEON INSTINCT」シリーズも発表した。AMDは、機械学習型AIを実践するためのGPGPU製品分野の市場シェアにおいて、競合のNVIDIA「TESLA」シリーズに後塵を拝している現状があるが、これを打開するための施策を講じてきた格好だ。
NVIDIAがこの分野で成功している背景には、「CUDA」(Compute Unified Device Architecture)と呼ばれるGPGPUプラットフォームの成功があるわけだが、AMDは「RADEON INSTINCT」の投入と同時に、このプラットフォーム面(ソフトウェアエコシステム)においてもテコ入れを行うようだ。
ハードウェアとしては、2016年12月にRADEON INSTINCTシリーズとして3製品「MI6」「MI8」「MI25」を発表した。製品型番のMIはMachine Intelligenceから、数字は半精度(FP16)のTFLOPS性能値から来ている。MI6のGPUコアはPolaris(RADEON RX400系)、MI8はFiji(RADEON R9 Fury系)、そしてMI25がVEGAを採用するものになる。
製品型番のMIはMachine Intelligenceから、数字はTFLOPS性能値から来ている機械学習向けGPGPU製品「RADEON INSTINCT」シリーズ
RADEON INSTINCT「MI25」を掲げるコドゥリ氏
RADEON INSTINCTはGPU製品ではあるが、HDMIやDisplayPortなどの映像出力端子を持たない、純粋な演算利用目的のGPUで、パッシブ冷却システム(電動ファンなし)を採用し、複数GPU搭載に対応し、ハードウェアレベルでの仮想化(SRIOV)にも対応する。機械学習においては、長大なデータを取り扱うことが必然であり、そのためには前述したようなCPU並の仮想メモリアーキテクチャが有効に効いてくるというわけだ。
また、現在、機械学習型AIはクラウド側で仮想化されたサービスとして提供される事例も増えてきているわけだが、その際にスケーラブルにハードウェア増強が行えることが重要になる。その面において、RADEON INSTINCTは、マルチGPU環境をハードウェアレベルで仮想化することにも対応しているため優位だとAMDは主張している。
RADEON INSTINCTの特徴
RADEON INSTINCTはマルチGPUの仮想化にハードウェアレベルで対応する
GPGUプラットフォーム、ソフトウェアエコシステムとしては、ROCm(RADEON OPEN COMPUTE)をオープンソースプロジェクトとしてスタートさせており、機械学習向けのミドルウェアしてはMIOpen(Machine Intelligence Open)も公開にふみきっている。ROCm層は、競合NVIDIAのもので喩えればCUDA層に相当するもので、AMD側の説明によれば、サードパーティなどの手によってROCmとCUDAのラッパー(相互変換層)が提供されれば、競合NVIDIAのCUDAアプリケーションも動作させることができるだろうとのことだ。
ROCmのソフトウェアスタック構造
<4>オフラインレンダリングのためのグラフィックワークステーション向けGPU製品「RADEON PRO SSG」シリーズも発表
2016年夏、「SSD搭載のグラフィックワークステーション向けGPU」というコンセプトだけが発表され、その素性がよくわかっていなかった製品「RADEON PRO SSG」が、実はVEGAベースだったということも、VEGAの発表とと同時に明かされた。
ユニークなSSD搭載のワークステーション向けグラフィックスボード「RADEON PRO SSG」。実はVEGA搭載製品であった
前述したようにVEGAでは、直近のレンダリングに必要なデータだけをキャッシュとして利用される高速なHBM2上に載せ、それ以外のデータを仮想メモリとしてその他の種別の記憶領域に置いておけるアーキテクチャが採用されたわけだが、その「その他の種別の記憶領域」を「GPUカード上に搭載したSSD」とした製品が「RADEON PRO SSG」なのである。SSD容量は現時点では非公開だが、VEGA発表時には、事前計算した20GBもの大局照明情報をこのSSD上に置いてのリアルタイムレイトレーシングデモが実機上で公開された。
20GBもの事前計算データをSSD上に載せ、リアルタイムレイトレーシングをRADEON PRO SSGで実践したデモの様子。映像は実機からのキャプチャ
実演デモに用いられたシーンの画面ショット
<5>おわりに〜CESではRyzen搭載製品の展示や新作デモも公開に
2017年1月5日(木)から8日(日)まで、ラスベガスで開催された家電ショウ「CES 2017」のAMDブースでは、前出のRADEON PRO SSGを用いてのリアルタイムレイトレーシングのデモの新バージョンを公開。新デモでは事前計算データ量が200GBとなり、より規模の大きいシーンでのリアルタイムレイトレーシングを実践していた。
「SSD搭載のグラフィックスボード」というと、奇妙な製品に思えるかも知れないが、VEGAアーキテクチャに鑑みればかなり理に叶った製品であり、実際のレンダリングファームでの採用が進めば、レンダリング速度の劇的な向上だけでなく、ネットワークトラフィックの削減にも結びつきそうだ。
CESではRADEON PRO SSG 4枚挿しマシンにて、200GBもの事前計算データを用いてリアルタイムレイトレーシングをデモ
また、AMDはRyzen搭載の各社デスクトップPC製品群やRyzen対応のマザーボード製品群も展示しており、より具体的な製品情報の開示や、実際の製品発売の日が近づいていることを予感させた。
Ryzen搭載デスクトップPCやRyzen対応マザーボード製品が多数展示された「CES 2017」のAMDブース