Lightricks社は10月23日(木)、オープンソースのAIクリエイティブエンジン「LTX-2」をリリースした。プロダクション向けに設計され、音声と同期したネイティブ4K・50fps、20秒の連続的なシーンの生成を可能とする。公式ワークスペースのLTX Studio API Playground、ComfyUIなどサードパーティ製ツールとの統合を通じて利用できる。コードとウェイトは11月下旬にGitHubで公開予定。

Introducing LTX-2: the most complete open-source AI creative engine.
- Synchronized audio and video generation
- Native 4K fidelity, up to 50 fps and 10 s+ sequences
- API-first design for seamless integration into creative pipelines
- Runs efficiently on consumer GPUs
- Fully open and accessible, with weights releasing later this year


LTX-2の登場:最も完成度の高いオープンソースAIクリエイティブエンジン
- 音声と映像の同期生成
- ネイティブ4K画質、最大50fps、10秒以上のシーケンスに対応
- 制作パイプラインへシームレスに統合可能なAPIファースト設計
- 一般消費者向けGPUでも効率的に動作
- 完全にオープンかつアクセス可能。モデルのウェイトは今年後半にリリース予定


LTX-2は、セリフ、環境音、音楽などが映像の動きと完全に同期した最大20秒間の連続したシーンを生成でき、アップスケーリングを介さないネイティブ4Kと最大50fpsのフレームレートをサポートする。アーキテクチャには、速度・制御性・効率を最適化したハイブリッド拡散トランスフォーマー(hybrid diffusion transformer)を採用。これにより、競合モデルと比較して最大50%低い計算コストを実現し、コンシューマー向けハイエンドGPUでも効率的に動作するという。

LTX-2は、プロダクションのワークフローを前提に設計されており、テキスト・画像・動画・音声入力のほか、デプス(深度)マップや参照動画をガイドとして使用できるマルチモーダル入力にも対応する。さらに、マルチキーフレーム・コンディショニングや3Dカメラロジックによる高度なシーン制御、LoRAアダプタによるファインチューニングも可能。

また、APIモードは「Fast」「Pro」「Ultra(近日公開)」の3種類を用意。ライブプレビューやモバイルには「Fast」を、シネマティック用途の最高品質(4K50fps)には「Ultra」をと、用途に応じて速度と品質のバランスを選択できる。

■LTX-2公式ページ
https://ltx.studio/#ltx2-section

■LTX Studio API Playground(Text to Video、Image to Video)
https://app.ltx.studio/ltx-2-playground/t2v
https://app.ltx.studio/ltx-2-playground/i2v

■LTX公式ヘルプ&ドキュメント
https://lightricks.zendesk.com/hc/en-us/categories/19590253809170-LTX

CGWORLD関連情報

●オープンソースのリアルタイム動画生成モデル「Krea Realtime 14B」リリース! NVIDIA B200 GPU 1基で11fps、ストリーミング生成中の編集に対応

Krea AIがオープンソースのリアルタイム動画生成モデル「Krea Realtime 14B」をリリース。コードはGitHubでCC BY-NC-SA 4.0ライセンス、ウェイトはHugging FaceでApache-2.0ライセンスとして公開されている。また、Kreaの公式ワークスペースでも生成モデルのひとつとして利用できる。
https://cgworld.jp/flashnews/01-202511-Krea-Realtime-14B.html

●動画生成AI「Wan 2.5-Preview」リリース! 新アーキテクチャ採用によりテキスト・画像・動画・音声のより強力なモーダルアライメントを実現、1080p・10秒・24fps出力対応

アリババグループが動画生成AIモデル「Wan 2.5-Preview」をリリース。新しいアーキテクチャの採用により、音声と映像を一体で生成し、高度な画像編集や顔・スタイルの一貫性維持を実現。1080p・10秒・24fpsのアウトプット、音声からの動画生成などにも対応する。オープンソースのWan 2.2とは異なり、Wan公式サイトやAPIを通じて利用できる。公式サイトでは、FreeプランでもWan 2.5-Previewを用いた生成は可能だが、待ち時間が発生する。
https://cgworld.jp/flashnews/01-202510-Wan-25-Preview.html

●動画生成AI「Kling AI 2.5 Turbo」リリース! 一貫性・安定性向上、価格30%引き下げ、ノードベースのワークスペース「Kling Lab」も全ユーザーに開放

快手が動画生成AI「Kling AI 2.5 Turbo」をリリース。プロンプトの忠実性と時間的制御の向上、ダイナミックなシーンでの流動性と安定性の向上、多様なスタイルとの一貫性維持などを実現している。また、ノードベースのワークスペース「Kling Lab」が全ユーザーに公開され、2.5 Turboがサポートされた。
https://cgworld.jp/flashnews/01-202510-Kling-AI-25-Turbo.html