Meta社のThe Fundamental AI Researchチームは7月2日(火)、テキストto3Dの生成AI技術「Meta 3D Gen」の論文を同社Webサイトに発表。テキストから3DモデルとPBRテクスチャをそれぞれ生成し統合する手法により、「既存の3Dモデル生成AIソリューションよりも優れたテクスチャ付き3Dモデルを従来の3~10倍のスピードで生成する」という。

Meta 3D Genの概要

Meta 3D Genでの3Dモデル生成のワークフローは2種類ある。ひとつめ(INPUT:STAGE I)はテキストプロンプトから3Dアセットを生成し、そのアセットと最初に入力したプロンプトから精密なテクスチャを生成する方法。もうひとつ(INPUT:STAGE II)は、プロンプトから3Dモデルを生成した後、新たなプロンプトを用いて精密なテクスチャをモデルに適用する方法。いずれの場合も、3Dモデルの生成に約30秒、テクスチャの生成に約20秒かかるとしている。

そしてINPUT:STAGE IIを利用した場合には、複数のモデルにわたって、テーマに基づいたテクスチャリングを再適用することも可能だ。

テーマを設定しテクスチャを再適用した例

3Dモデル生成AI技術の比較では、STAGE IとSTAGE IIを組み合わせた場合、Meta 3D Genでの生成時間は1分と高速で、かつ高品質なテクスチャを生成できるという。

各種テキストto3Dソリューションによる生成可能範囲・生成時間の比較表
INPUT:STAGE Iで生成した3Dモデル群(左)とSTAGE IIで生成したモデル群(右)。後者ではより高品質なテクスチャを生成できる
テキストプロンプトと生成された3Dモデルの例

共通のテキストプロンプトを用いて、各種テキストto3D手法で3Dモデルを生成した際の比較でも、生成クオリティ・生成時間共にMeta 3D Genが上回るとしている。

  • 各種テキストto3Dソリューションとの生成結果比較

発表された論文PDFはこちらからダウンロードできる。

●Meta 3D Gen(AI at Meta)
​​https://ai.meta.com/research/publications/meta-3d-gen/

CGWORLD関連情報

●テキスト to 3Dの生成AI「Rodin」オープントライアル開始! ジオメトリ&マテリアル生成からデータダウンロードまで無料で試用可能

Deemos Technologyによる3D生成AI「Rodin」パブリックベータ版リリースを報じた記事。
https://cgworld.jp/flashnews/202406-AI-Rodin.html

●Runway、動画生成AIの新ベースモデル「Gen-3 Alpha」発表! 多数のデモ動画のクオリティに注目集まる

Runway AI社による動画生成AIの最新モデルGen-3 Alpha発表を報じた記事。
https://cgworld.jp/flashnews/202406-Gen3alpha.html

●テキストまたは画像から5秒の動画を生成するAI「Dream Machine」リリース! 無料で月30本まで生成可能

Luma AIが動画生成AI「Dream Machine」を一般公開。テキストや画像から5秒間の動画を生成できる。
https://cgworld.jp/flashnews/202406-DreamMachine.html

●OpenAIの動画生成AI「Sora」発表! 破綻の少ない高品質な動画生成能力に多業界が注目

OpenAIが発表した、テキストから最大60秒の動画を生成できる「Text-to-Video」モデルの動画生成AI「Sora(ソラ)」の紹介記事。
https://cgworld.jp/flashnews/202402-OpenAISora.html