Googleは4月15日(火)、同社マルチモーダル生成AI「Gemini」のGemini Advancedユーザー(月1,900円)、同社生成AI試験的プロジェクト「Whisk」のGoogle One AIプレミアムプランユーザー(月2,900円)に対して動画生成AIモデル「Veo 2」の提供を開始した。
「Gemini」は、Googleアカウントを持つユーザーに無償で提供されるマルチモーダル生成AI(パーソナルAIアシスタント)。コード生成やドキュメント編集(Canvas機能)、掘り下げたビジネス分析などに利用できるDeep Researchとオーディオ概要作成、パーソナライズされた検索履歴や行動履歴などを用いたパーソナライズ機能による提案、画像生成などが行える。

月額1,900円で利用できるGemini Advancedプランのユーザーには、それらに加えて動画生成モデルVeo 2の利用、Deep Researchへのフルアクセス、長文分析を始めとするプレミアム機能へのアクセスを提供される。

Dive into video creation with @GeminiApp — rolling out today.
— Google (@Google) April 15, 2025
Transform text prompts into cinematic 8-second videos with Veo 2 in Gemini Advanced. Select Veo 2 from the model dropdown menu to get started.
Prompt: Write the word "GOOGLE" out of skydiving parachutes opening up pic.twitter.com/IHTmhELUut
また、Google Labsの生成AIの試験的プロジェクト「Whisk」では「Whisk Animate」機能が拡張され、Whisk Animateで生成した画像からVeo 2を使って8秒間の動画を生成できるようになった。機能の利用には、Google One AIプレミアムプラン(月額2,900円)のサブスクリプションが必要となる。


■Gemini: Veo 2 による動画生成機能を提供開始(Googleブログ)
https://blog.google/intl/ja-jp/company-news/technology/gemini-veo-2/
■Gemini
https://gemini.google.com/app
■Whisk
https://labs.google/fx/ja/tools/whisk
CGWORLD関連情報
●動画生成AI「Kling AI 2.0」メジャーバージョンアップ! テキストや画像入力に基づく動画コンテンツの柔軟な追加・入れ替え・削除、画像編集、スタイル変更機能

快手(Kuaishou)が動画生成AI「Kling AI 2.0」をリリース。画像と動画のベースモデルがメジャーバージョンアップしたほか、従来の動画モデル(KLING 1.6)に複数要素編集機能が追加され、テキストまたは画像入力によるフレキシブルな追加や差し替え、削除などが行えるようになった。画像生成では、インペイントや拡張、スタイル変更機能が追加されている。
https://cgworld.jp/flashnews/01-202504-Kling-AI-20.html
●1枚の画像からシネマティックな動画を生成するAI「Higgsfield」リリース! 45種以上の芸術的カメラモーションプリセット搭載、2つのモーションをミックスする機能も

Higgsfieldが動画生成AIプラットフォーム「Higgsfield」に新しい動画生成AIモデル「Higgsfield DoP I2V-01-preview」を追加。プリセット化された多様なカメラモーションコントロールによりシネマティックな動画を生成できるほか、1ショットに2つのモーションコントロールをミックスできる「Higgsfield Mix」も利用できる。
https://cgworld.jp/flashnews/01-202504-Higgsfield-AI.html
●Metaら、映画レベルの自然な発話アニメーションが生成できるAIモデル「MoCha」発表! 自然言語・音声入力から直接対話アニメーションを生成可能

Metaとウォータールー大学の研究チームが、自然言語や音声入力から直接キャラクターの動作や表情を伴う発話アニメーションを生成できるDiTモデル「MoCha」を発表。
https://cgworld.jp/flashnews/01-202504-MoCha.html