Googleは4月15日(火)、同社マルチモーダル生成AI「Gemini」のGemini Advancedユーザー(月1,900円)、同社生成AI試験的プロジェクト「Whisk」のGoogle One AIプレミアムプランユーザー(月2,900円)に対して動画生成AIモデル「Veo 2の提供を開始した。

「Gemini」は、Googleアカウントを持つユーザーに無償で提供されるマルチモーダル生成AI(パーソナルAIアシスタント)。コード生成やドキュメント編集(Canvas機能)、掘り下げたビジネス分析などに利用できるDeep Researchとオーディオ概要作成、パーソナライズされた検索履歴や行動履歴などを用いたパーソナライズ機能による提案、画像生成などが行える。

▲無料版Geminiでアクセスできる機能群

月額1,900円で利用できるGemini Advancedプランのユーザーには、それらに加えて動画生成モデルVeo 2の利用、Deep Researchへのフルアクセス、長文分析を始めとするプレミアム機能へのアクセスを提供される。

▲Gemini Advancedへのアップグレード申込画面
▲GeminiからVeo 2で生成したサンプル動画。プロンプトは「Write the word "GOOGLE" out of skydiving parachutes opening up」
▲別のサンプル動画。プロンプトは「A wide, slow-panning shot of an enormous glacial cavern, bathed in eerie twilight. Pale cyan light filters from above, illuminating frozen candy figures within the ice walls. Two figures in white exosuits, their helmet lights casting beams, trudge through the center. Capture the cavern's scale and stillness.」
▲Veo 2の先行パートナー・吉本興業は、大阪・関西万博の展示作品『問いかけられるネギ』のPR動画をVeo 2で制作

また、Google Labsの生成AIの試験的プロジェクト「Whisk」では「Whisk Animate」機能が拡張され、Whisk Animateで生成した画像からVeo 2を使って8秒間の動画を生成できるようになった。機能の利用には、Google One AIプレミアムプラン(月額2,900円)のサブスクリプションが必要となる。

▲Whiskの新機能Whisk Animateでは、Veo 2を利用して画像から8秒の動画を生成できる
▲Whiskによる画像生成では、「モデル」、「背景」、「スタイル」の3要素について、それぞれテキストプロンプトまたは画像入力を行うことができ、さらにシーンの詳細情報を画面下部白枠のテキストプロンプトで補足できる
▲Whiskによる画像生成の紹介動画
▲Whisk AnimateでVeo 2を利用するためには、Google One AIプレミアムプランへの加入が必要

■Gemini: Veo 2 による動画生成機能を提供開始(Googleブログ)
https://blog.google/intl/ja-jp/company-news/technology/gemini-veo-2/

■Gemini
https://gemini.google.com/app

■Whisk
https://labs.google/fx/ja/tools/whisk

CGWORLD関連情報

●動画生成AI「Kling AI 2.0」メジャーバージョンアップ! テキストや画像入力に基づく動画コンテンツの柔軟な追加・入れ替え・削除、画像編集、スタイル変更機能

快手(Kuaishou)が動画生成AI「Kling AI 2.0」をリリース。画像と動画のベースモデルがメジャーバージョンアップしたほか、従来の動画モデル(KLING 1.6)に複数要素編集機能が追加され、テキストまたは画像入力によるフレキシブルな追加や差し替え、削除などが行えるようになった。画像生成では、インペイントや拡張、スタイル変更機能が追加されている。
https://cgworld.jp/flashnews/01-202504-Kling-AI-20.html

●1枚の画像からシネマティックな動画を生成するAI「Higgsfield」リリース! 45種以上の芸術的カメラモーションプリセット搭載、2つのモーションをミックスする機能も

Higgsfieldが動画生成AIプラットフォーム「Higgsfield」に新しい動画生成AIモデル「Higgsfield DoP I2V-01-preview」を追加。プリセット化された多様なカメラモーションコントロールによりシネマティックな動画を生成できるほか、1ショットに2つのモーションコントロールをミックスできる「Higgsfield Mix」も利用できる。
https://cgworld.jp/flashnews/01-202504-Higgsfield-AI.html

●Metaら、映画レベルの自然な発話アニメーションが生成できるAIモデル「MoCha」発表! 自然言語・音声入力から直接対話アニメーションを生成可能

Metaとウォータールー大学の研究チームが、自然言語や音声入力から直接キャラクターの動作や表情を伴う発話アニメーションを生成できるDiTモデル「MoCha」を発表。
https://cgworld.jp/flashnews/01-202504-MoCha.html