ブラウン大学Adobe Researchからなる研究チームは、2025年12月に発表した論文「Residual Primitive Fitting of 3D Shapes with SuperFrusta」に基づく3Dモデル変換技術「SuperFit」を、6月3日(水)から開催されたコンピュータビジョンの国際会議「CVPR 2026」で口頭発表した。Hugging Faceでは研究目的に限定してデータセットが提供されている。

新開発のプリミティブ「SuperFrusta」の導入

「SuperFit」は、複雑な3D形状を、コンパクトかつ人間が解釈・編集可能なプリミティブの集合体に圧縮・変換する実験的なフレームワーク。SuperFrustaと呼ばれる、新たに定義された解析的なプリミティブにより、円柱、球、円錐といった一般的な立体から、それらのテーパーや湾曲、さらには中空構造まで、多岐にわたる形状をわずか8つのパラメータで表現できる。

このプリミティブはSDF(Signed Distance Field、符号付き距離場)として定義され、全パラメータに対して微分可能となっている。これにより、勾配降下法(Gradient Descent)などの数理的な最適化手法を直接適用でき、複雑なターゲット形状に対するスムーズなフィッティングを実現する。

残差を用いたフィッティングアルゴリズム「ResFit」

SuperFrustaを3D形状に適用するための推論アルゴリズムとして、「ResFit(Residual Primitive Fitting)」と呼ばれる手法が開発された。これは、全体形状の分析と局所的な最適化を交互に行う教師なし学習のプロセス。

従来の手法のように多数のプリミティブをゼロから一斉に最適化するのではなく、ResFitではまず大まかな全体構造を分析して初期形状を配置し、局所的なジオメトリに合わせて勾配ベースで最適化する。その後、元の形状からフィッティング済みの部分を差し引いた残差(Unexplained Residual)に対して同じプロセスを反復する。

また、プリミティブに分解しながら3Dモデルを生成するAI技術と比較して、約半数のプリミティブ数で形状を表現でき、パーツ間の体積の重なりも大幅に削減できるとのこと。

SuperFitが生成したデータの活用

SuperFitでは、単なるポリゴンの塊ではなく、人間が解釈可能なシェイププログラム(Shape Programs)を出力する。一例として、AIから出力された扱いづらいメッシュデータをSuperFitで変換することで、構築的なジオメトリ(CSG、Constructive Solid Geometry)として再解釈し、特定のパーツの太さや湾曲度合いを後からパラメータレベルで微調整することができるようになる。

■A Single Primitive to Rule Them All: SuperFit at CVPR 2026 Compresses 3D Shapes into Editable Building Blocks(Adobe Research)
https://research.adobe.com/news/superfit-at-cvpr-2026-compresses-3d-shapes-into-editable-building-blocks/

■Residual Primitive Fitting of 3D Shapes with SuperFrusta(プロジェクトページ)
https://bardofcodes.github.io/superfit/

ライセンスについて

GitHubの「superfit」リポジトリは、現時点ではプロジェクトの公式サイトを構築するためのソースコードがホストされている。Hugging Faceで公開されているデータセット「superfit-primitive-assemblies」は、非営利の調査および研究目的に限定して提供され、CC BY-NC 4.0ライセンスが適用されている。ただし、データセットを読み込むためのヘルパースクリプトなど一部のコードにはMITライセンスが適用されている。本データセットの一部または全部を商用利用したい場合は、事前に書面による許可が必要。

■SuperFit: Residual Primitive Fitting with SuperFrusta(GitHub)
https://github.com/bardofcodes/superfit/

■SuperFit Primitive Assembly Release(Hugging Face)
https://huggingface.co/datasets/bardofcodes/superfit-primitive-assemblies

CGWORLD関連情報

●3D生成AI「Rodin Gen-2.5」リリース 最大1,000万ポリゴンの生成が可能に、4秒100万ポリゴンの高速生成、LLM的思考プロセス搭載、12Kテクスチャ

Deemosが3Dモデル生成AIプラットフォーム「Rodin Gen-2.5」をリリース。バージョン2.5では、1,000万ポリゴン規模のモデル生成が可能となったほか、4秒で100万ポリゴンを生成する高速処理、LLMに見られる適応的な思考プロセスが導入されている。サービスは初月2.99ドル(約500円)のライト版をはじめとするサブスクリプション形式で提供されている。
https://cgworld.jp/flashnews/01-202606-RodinGen-2.5.html

●テンセント、3Dモデル生成AI「Pixal3D」発表 ピクセルアラインドにより入力画像に忠実な3D再現を実現

清華大学、Tencent ARC Lab、ビクトリア大学ウェリントンからなる研究チームが、単一の画像から高精細な3Dアセットを生成する技術「Pixal3D」を発表。ソースコードはGitHub、学習済みモデルはHugging Faceにて、どちらもオープンソース(MITライセンス)で公開した。入力画像のピクセル情報と生成される3Dモデルの対応関係を直接的に結びつけるピクセルアラインド(Pixel-Aligned)な生成手法の採用により、オリジナル画像に忠実な再構築を実現する。7月開催のSIGGRAPH 2026への採択も決定。
https://cgworld.jp/flashnews/01-202606-Pixal3D.html

●Blenderを人間同様に操作して3Dシーンを生成するエージェント「Moonlake's 3D Agent」ベータ公開 AIがマウスとキーボードを操作し、モデリングからシーン構築、リギングまで実行

Moonlakeが単一画像から複雑な3D環境を自動生成するAI技術「Moonlake's 3D Agent」を発表。AIエージェントが3DCGツールの画面を認識し、人間と同様にアセットのモデリングやシーン構築、リジッドボディのセットアップまでを自律的に行う能力を持つ。第1弾の対応DCCツールはBlender。
https://cgworld.jp/flashnews/01-202605-Moonlake.html