香港大学の研究チームと「Tiktok」のByteDance社は2月12日(水)、動画生成AI「Goku」の論文を発表し、GitHubのリポジトリやサンプル動画を公開した。高速推論を実現する最先端のアルゴリズム「Rectified Flow Transformers」をベースにしたモデルで、テキストや画像からの動画生成、テキストからの画像生成を行える。

プロジェクトページには多数のサンプル動画が掲載されている
▲ポートレート(縦長)動画の生成にも対応する
  • ▲テキストからの画像生成(論文PDFより)
  • ▲テキストからの動画生成(論文PDFより)
▲画像からの動画生成(論文PDFより)。左端が入力画像
▲他社製動画生成AIとの生成品質比較(論文PDFより)

動画広告に特化した「Goku+」も用意

Gokuの商用ソリューションとして、動画広告用モデル「Goku+」も用意。テキストからのマーケティングアバター生成や、商品画像のビデオクリップ変換機能を備えるほか、商品とアバターを動画内でインタラクションさせることができ、リアルな動画広告を作成できるものとなる。

▲商品画像をアバターが紹介したり使用したりする動画広告の作成が可能

■Gokuプロジェクトページ(英語)
https://saiyan-world.github.io/goku/

■Goku: Flow Based Video Generative Foundation Models(GitHub、英語)
https://github.com/Saiyan-World/goku

CGWORLD関連情報

●動画生成AI「Pika 2.1」公開! キャラ画像などを動画内に合成できる新機能「Pikadditions」も追加

Mellisが動画生成AIモデル「Pika 2.1」をリリースし、キャラクターやオブジェクトなどの画像をあらゆる動画内に合成し、AIで動画生成できる新機能「Pikadditions」も追加。Pika 2.1モデルの利用には有料プランが必要だが、Pikadditionsは無料プランのユーザーも利用可能。
https://cgworld.jp/flashnews/202502-Pika21-Pikadditions.html

●日本初の日本語対応の動画生成AI基盤モデル「AIdeaLab VideoJP」無償公開! 商用利用可、ライセンスに考慮しゼロから動画学習

AIdeaLabが動画生成AI基盤モデル「AIdeaLab VideoJP」をHugging Faceで公開。日本語および英語のプロンプト文から動画を生成でき、生成動画の商用利用も可能。ライセンスはApache-2.0。
https://cgworld.jp/flashnews/202502-AIdeaLab-VideoJP.html

● Luma AI、「Dream Machine」で利用可能な新しい動画生成モデル「Ray2」発表! 自然で一貫した動きのリアルな映像を生成

Luma AIが動画生成AI「Dream Machine」で利用可能な新しい動画生成モデル「Ray2」を発表し、Dream Machine内で利用可能にした。従来のRay1.6と比較して高速で一貫性のある動作やリアルなディテール、論理的なイベントシーケンス生成が可能だという。
https://cgworld.jp/flashnews/202501-Luma-Ray2.html