上海科技大学、3Dモデル生成AI「Rodin」のDeemos社、華中科技大学の研究チームは5月5日(月)、1枚のRGB画像から3Dシーンを再構築する手法「CAST: Component-Aligned 3D Scene Reconstruction from an RGB Image」を発表した。Rodin次期バージョンへの搭載を予定している。
写真や画像から3Dシーンを再構築する従来の技術では、オブジェクトの浮遊や貫通、非現実感などといった課題があったが、CASTではシーン内のオブジェクト同士の自然な関係を再現できる点が特徴となる。
CASTではまず、入力画像からシーン内の「椅子」や「机」などのオブジェクトと場所を特定し、各オブジェクトに対して2D分割(セグメンテーション)と相対的な深度情報抽出を行う。
続いて、GPTベースのモデルを利用してオブジェクト間の空間的関係を分析し、オクルージョン(隠れた部分のジオメトリ)認識型の大規模3D生成モデルを活用して、各オブジェクトの完全なジオメトリを生成する。
最後に、物理認識補正プロセスにより常識や物理法則に沿って調整を施し、空間的・物理的な一貫性を確保する。






■CAST: Component-Aligned 3D Scene Reconstruction from an RGB Image(プロジェクトページ、英語)
https://sites.google.com/view/cast4
CGWORLD関連情報
●「Meta 3D AssetGen 2.0」発表! Metaの3Dアセット生成AI基盤モデルがアップデート、2025年後半よりHorizonクリエイターに提供予定

Metaが次世代の3Dアセット生成AI基盤モデル「Meta 3D AssetGen 2.0」を発表。単一ステージの3D拡散(diffusion)モデルを採用することにより、前世代と比較して高品質なメッシュとテクスチャを効率的に生成できるという。テキストまたは画像からの3Dアセット生成に対応する。
https://cgworld.jp/flashnews/01-202505-Meta-3D-AssetGen-20.html
●3Dモデル生成AI「Meshy」に自動リギング機能と複数画像からの3Dモデル生成機能が追加! リギングは人型と犬に対応、無料プランで利用可

Meshyが3Dモデル生成AI「Meshy」に自動リギング機能を追加。まずは人型と犬のリグに対応しており、人型はTポーズまたはAポーズのモデルに適用できる。無料プランでも利用可能。
https://cgworld.jp/flashnews/01-202505-Meshy-AutoRig.html
●Tencentの3Dモデル生成AI「Hunyuan3D 2.5」リリース! モデルのパラメータ10倍、4Kテクスチャ、マルチビューPBR、自動リギング、1日20回まで無料生成可能

テンセントが3Dアセット生成AI「Hunyuan3D 2.5」をリリース。モデルのパラメータ数が大幅に増加したことによりシャープなエッジを描出できるようになったほか、4Kテクスチャ、マルチビューPBR、自動リギング(ボーンのバインドとウェイト設定)にも対応。公式ワークスペースのTencent Hunyuan 3D AI Creation Engineで利用でき、1日20回まで無料で生成が行える。
https://cgworld.jp/flashnews/01-202505-Hunyuan3D-25.html