Meta AI Researchの研究チームは3月8日(土)、3Dディープラーニングや3D生成AIの発展を目的として、新しい3Dオブジェクトのデータセット「uCO3D(UnCommon Objects in 3D)」を公開した。

uCO3Dは、3Dモデルを扱う各種AIの学習に欠かせないデータのニーズに応えるため、従来のデータセットよりも多様な1,000以上のオブジェクトの3Dデータを集め、データセットとして提供するもの。

各オブジェクトには360°全方向から撮影した高解像度動画が用意され、3Dアノテーション(カメラ位置、深度、ポイントクラウド)も記録されている。

また、オブジェクトを含むシーンには簡単なキャプションが付与されており、シーンは3D Gaussian Splattingで再構築され、インタラクティブビューアを通して閲覧できる。

▲3D Gaussian Splattingで再構築されたシーンと生成されたシーンのキャプション(下部に記載されているテキスト)

また、各シーンはVGGSfM(Visual Geometry Grounded Deep Structure From Motion)で再構成され、フレームごとのカメラのアノテーションをもつ粗いポイントクラウドと、密なポイントクラウドの両方が得られる。

▲(上段)入力動画、(中段)粗いポイントクラウドとカメラアノテーション、(下段)密なポイントクラウド

uCO3Dデータセットの活用例

uCO3Dはテキストプロンプトから3Dモデルを生成するAIのトレーニングに利用でき、プロジェクトページにはそのサンプルが紹介されている。

■UnCommon Objects in 3D(uCO3D)(プロジェクトページ、英語)
https://uco3d.github.io/

CGWORLD関連情報

●4枚の顔写真からアバター頭部モデルを生成できる手法「Avat3r」発表! 高品質かつフェイシャルアニメーション可能な3D Gaussian Splattingモデル、オープンソース

ミュンヘン工科大学とMeta Reality Labsの研究チームが、スマートフォンで4枚程度の顔写真を撮影するだけで、高品質なフェイシャルアニメーション対応の3D Gaussian Splattingによるアバター頭部モデル生成が可能なニューラルネットワーク手法「Avat3r」を発表。オープンソース技術としてGitHubでのコード公開が予定されている。
https://cgworld.jp/flashnews/202503-Avat3r.html

●タブレットで描いたラフが3Dメッシュに! 生成AIによるメッシュ作成・編集技術「MeshPad」発表

ミュンヘン工科大学とアウディの研究チームが、生成AIによりスケッチからインタラクティブにメッシュの作成と編集が可能となる技術「MeshPad」の論文を発表。大規模なトランスフォーマー(ニューラルアーキテクチャの一種)モデルを利用することで、スケッチによる形状の追加と削除を高品質なメッシュに置き換えることを可能にしている。ソースコードは今後公開予定。
https://cgworld.jp/flashnews/202503-MeshPad.html

●3D PBRアセットを5秒で生成するオープンソースのAI技術「3DTopia-XL」! AIカンファレンスCVPR 2025採択

南洋理工大学(シンガポール)、北京大学、Shanghai AI Laboratory、香港中文大学の研究チームは、AIによる高速・高品質な3D PBRアセット生成技術「3DTopia-XL」が、IEEEとCVFが6月に開催するAIカンファレンス「CVPR 2025」で採択されたことを発表。
https://cgworld.jp/flashnews/202503-3DTopiaXL.html