画像生成AI「Stable Diffusion」などで知られるStability AIは8月1日(木)、1枚の画像から高速で3Dアセットを生成できるAI「Stable Fast 3D」をリリースした。Hugging Faceにはデモスペースも用意されており、気軽にテストできる状態となっている。

Stable Fast 3Dは、画像を1枚アップロードするだけで、わずか0.5秒でUV展開済みのメッシュ、マテリアルパラメータ、照明のベイクを抑えたAlbedoカラーを含む完全な3Dアセットを生成するという。また、オプションとして三角形または四角形ポリゴンによるリメッシュ作業も可能だ(この場合、処理時間が100~200ms増加する)。

なお、本モデルはStability AI APIStable Assistantチャットボットでも利用できる。


Stable Fast 3Dは従来開発を進めていた「TripoSR」の後継にあたるものだが、アーキテクチャは大幅に変更され、再トレーニングを経た結果、メッシュ生成の速度と品質が向上。生成速度は従来の10分から0.5秒へと大幅に短縮されている。

従来のTripoSRとStable Fast 3D(SF3D)の品質比較。上からライトのベイクイン、頂点カラー、マーチングキューブ法(ボクセルデータのポリゴン化)、マテリアルパラメータ。いずれの品質も大きく向上していることがわかる

また、競合他社のモデルとの比較では、先に述べた高速な生成速度だけでなく、高品質なUVアンラップメッシュとマテリアルパラメータ、テクスチャにおける照明の干渉の低減、追加マテリアルパラメータとノーマルマップの生成機能において、Stable Fast 3Dが大きく上回っているという。

●Stable Fast 3Dモデルコード(GitHub)
https://github.com/Stability-AI/stable-fast-3d

●Stable Fast 3Dモデルウェイト(Hugging Face)
https://huggingface.co/stabilityai/stable-fast-3d

●Stable Fast 3Dデモスペース(Hugging Face)
https://huggingface.co/spaces/stabilityai/stable-fast-3d

●Stable Fast 3Dプロジェクトページ
https://stable-fast-3d.github.io/

CGWORLD関連情報

●Meta、3Dモデル生成AI「Meta 3D Gen」発表! テキストプロンプトから3DモデルとPBRテクスチャを高速生成、テクスチャ再生成による複数モデルのルック統一も

Meta社がテキストto3Dの生成AI技術「Meta 3D Gen」の論文を同社Webサイトに発表。
https://cgworld.jp/flashnews/202407-meta3dgen.html

●「Stable Diffusion」開発元 Stability AI の日本チーム代表ジェリー・チー氏が登場!日本市場での施策、AIと仕事について語る。

Stability AI、日本チームの代表ジェリー・チー氏へのインタビュー。2023年3月時点での「Stable Diffusion」の今後の展開やStability AIが実現したい世界、加えてAIサービス提供者視点からみる今後のクリエイター像、AI活用のポイントなどについて伺っている。
https://cgworld.jp/article/202304-stablediffusion.html

●NVIDIA ResearchによるSIGGRAPH 2024プレビュー! AIとシミュレーションにスポットを当てた重要な研究結果が多数発表

NVIDIA Researchが公開したシミュレーションと生成AIに関する研究内容の紹介。2024年7月末開催のSIGGRAPH 2024で発表される。
https://cgworld.jp/flashnews/202407-Nvidia-Siggraph.html