中国・快手(Kuaishou)社4月15日(火)、動画生成AI「Kling AI 2.0」をリリースした。画像と動画のベースモデルがメジャーバージョンアップしたほか、従来の動画モデル(KLING 1.6)に複数要素編集機能が追加され、テキストまたは画像入力によるフレキシブルな追加や差し替え、削除などが行えるようになった。画像生成では、インペイントや拡張、スタイル変更機能が追加されている。

▲Kling AIのワークスペース
  • ▲動画生成のワークスペース
  • ▲画像生成のワークスペース

動画生成のベースモデル:KLING 2.0 Master

従来モデル(KLING 1.6)と比較してアクションや表情、カメラの動きなどについてよりプロンプトに忠実な生成結果が得られるようになった。また、シーケンシャルなアクションを含む複雑なプロンプトもサポートする。

▲入力画像。プロンプトは「The man first laughs happily, then suddenly becomes angry, pounding the table and standing up.」(男はまず楽しそうに笑い、突然怒り出し、テーブルを叩いて立ち上がった)
▲KLING 1.6で生成した結果
▲KLING 2.0 Masterで生成した結果

また、ダイナミクスが大幅に向上し、キャラクターや被写体の可動域が広がり、ながれるような動きと自然なスピードを実現できたという。

▲入力画像。プロンプトは「The dinosaur charges towards the camera, with motion blur and the camera shaking.」(恐竜がカメラに向かって突進する。モーションブラーとカメラシェイクがある)
▲KLING 1.6で生成した結果
▲KLING 2.0 Masterで生成した結果

その他、テキストからの動画生成時にはよりシネマティックでリッチなディテール表現が行えるようになったほか、画像からの動画生成時には、描画スタイルの一貫性が向上したとのこと。

画像生成のベースモデル:KOLORS 2.0

画像生成ベースモデルのアップデートにおいても、従来よりもプロンプトに忠実な生成結果が得られるようになり、60以上の新しいスタイルを解釈できるようになったほか、よりシネマティックなビジュアルやリアルな描写が可能になったという。

▲プロンプト「A banquet hall filled with white tables, surrounded by people enjoying a delicious meal.」(白いテーブルで埋め尽くされた宴会場で、おいしい食事を楽しむ人々に囲まれている)からの画像生成結果

その他、シンプルなプロンプトを使ったリスタイル機能、生成画像へのインペイントや拡張も行えるようになった。

▲元画像(左)、プロンプト「change to Retro fairy tale」でリスタイルを適用した結果(右)

▲元画像にインペイント範囲を指定(左)、プロンプト「Wears cool sunglasses」でインペイントを適用した結果(右)

複数要素の編集機能(Multi-Elements Editor)

KLING 1.6には複数要素の編集機能が追加され、1〜5秒の動画をアップロード後、テキストまたは画像入力を用いて追加(add)、差し替え(swap)、削除(delete)を行えるようになった。

▲元動画
▲入力画像とプロンプト「Swap the panda from @image for the man from @video」
▲適用結果

■Kling AI
https://klingai.com/global/

■Kling AI Creative Studio(画像・動画生成のワークスペース)
https://app.klingai.com/global/

■Kling AI Release Notes(英語)
https://app.klingai.com/global/release-notes

■Kling AI User Guide(英語)
https://docs.qingque.cn/d/home/eZQDT9y_PeLL-HOb7fWz1POgu?identityId=2E3S0NySBQy

▲ローンチイベント動画

KLING AI 2.0ユーザーやパートナーによる生成作品

プランと価格

Standard・Pro・Premier、3種類のサブスクリプションプランが用意されている。Standardプランは年払いで79.2ドル(約11,310円)、月払いで6.99ドル(約1,000円)。その他、クレジットのみの販売やギフトカードの販売も行っている。

https://app.klingai.com/global/membership/membership-plan

CGWORLD関連情報

●1枚の画像からシネマティックな動画を生成するAI「Higgsfield」リリース! 45種以上の芸術的カメラモーションプリセット搭載、2つのモーションをミックスする機能も

Higgsfieldが動画生成AIプラットフォーム「Higgsfield」に新しい動画生成AIモデル「Higgsfield DoP I2V-01-preview」を追加。プリセット化された多様なカメラモーションコントロールによりシネマティックな動画を生成できるほか、1ショットに2つのモーションコントロールをミックスできる「Higgsfield Mix」も利用できる。
https://cgworld.jp/flashnews/01-202504-Higgsfield-AI.html

●Metaら、映画レベルの自然な発話アニメーションが生成できるAIモデル「MoCha」発表! 自然言語・音声入力から直接対話アニメーションを生成可能

Metaとウォータールー大学の研究チームが、自然言語や音声入力から直接キャラクターの動作や表情を伴う発話アニメーションを生成できるDiTモデル「MoCha」を発表。
https://cgworld.jp/flashnews/01-202504-MoCha.html

●Runway、動画生成AI「Gen-4」リリース! 一貫性・忠実性・制御性の向上、ダイナミックなモーションを実現

Runway AIが動画生成AI「Gen-4」をリリース。Gen-3 Alphaよりもシーン内で一貫性のあるキャラクターやロケーション、オブジェクトを正確に生成できるようになったほか、シーン内の複数の視点や位置から首尾一貫した環境を維持した映像の再生成にも対応する。Gen-4の利用には有料プランのサブスクリプションが必要となる。
https://cgworld.jp/flashnews/01-202504-Runway-Gen-4.html