中国・アリババグループは9月23日(火)、オープンソースの画像編集に特化した生成AIモデル「Qwen-Image-Edit-2509」をGitHubで公開した。テキストプロンプトにより高度で直感的な画像編集が可能で、特に複数の画像の自然な合成機能が特長。公式「Qwen Chat」から「画像編集」機能として利用できる。

「Qwen-Image-Edit-2509」は、人物と人物、人物と商品、人物と風景など、複数の画像を違和感なく組み合わせ、新しい画像を生成できる。また、人物画像のポーズや服装、背景を変更した際にも高い一貫性を維持したまま画像編集が行える。

▲2枚の人物写真を使ったウェディングフォトの画像編集。中央と右がそれぞれプロンプトと生成結果
▲人物写真と配置先写真を使った画像編集。左はデッキチェアで日光浴をしている女性を、右はソファでコーヒーを飲んでいる様子をそれぞれ生成
▲商品写真とモデルを合成する画像編集。左はバッグをかけた女性、右は自動車の横に立つ女性の画像をそれぞれ生成している

画像内にテキストを追加・編集する機能も備え、正確なテキストを描画に加え、フォントや色、質感などもプロンプトにより指示できる。

▲画像内テキストのフォントタイプを変更した例

また、ControlNetのネイティブサポートにより、キーポイントマップ(AIに渡す骨格図)や棒人間のスケッチ、輪郭の画像を入力として、ポーズや構図を精密にコントロール可能。オープンソースで提供され、すでに「ComfyUI」などの画像生成ツールにも対応。ローカル環境で実行することもできる。

▲人物、衣装、キーポイントマップの3画像を使った画像編集。キーポイントマップに従って女性がポーズを取り、黒い衣装を纏う画像を生成
▲スケッチからの画像生成。上部中央のスケッチを使って、若い女性(左)と老人(右)を生成
▲デプスマップ画像のみを使って異なるプロンプトで自転車の画像を生成した例
▲人物の一貫性を維持したままポーズ編集。左が元画像、他3枚が生成画像

■Qwen Chat(Image Edit)
https://chat.qwen.ai/?inputFeature=image_edit

CGWORLD関連情報

●NVIDIAの新AIモデル「LuxDiT」発表! 単一画像・動画から高品質なHDR環境マップを生成できる拡散トランスフォーマー

NVIDIA、トロント大学、ベクター人工知能研究所からなる研究チームが、1枚の画像・動画からその場所のリアルなライティングを推定し、高精度なHDR環境マップを生成できるDiT(Diffusion Transformer、拡散トランスフォーマー)、「LuxDiT」を発表。コードは近日公開される予定。
https://cgworld.jp/flashnews/01-202509-LuxDiT.html

●図面・スケッチからリアルな建築ビジュアルを生成! アリババのオープンソース画像編集AIモデル「Qwen-Image-Edit」活用例

アリババグループが画像生成機能「Qwen-Image-Edit」を使って図面・スケッチからリアルな建築ビジュアルを生成する活用例をXに投稿。Qwen-Image-Editは8月19日(火)に公開された、テキストの指示のみで写真の修正やクリエイティブな変更が可能な新しいAI画像編集モデル。AIアシスタント「Qwen Chat」で誰でも利用可能なほか、GitHubではオープンソース(Apache-2.0ライセンス)でコードが公開されている。
https://cgworld.jp/flashnews/01-202509-Qwen-Image-Edit.html

●低解像度のGoogle Earthのスクリーンショットを高解像度のドローン写真に変換! Ismail Seleit氏がFLUX Kontext LoRAのトレーニングで実現、無料ダウンロード可能

Ismail Seleit氏が自身のLinkedInで「RealEarth-Kontext LoRA」のリリースを発表。低解像度のGoogle Earthのスクリーンショットを高解像度のドローン写真に変換できる無料のモデルで、同氏が運営する建築デザイン向け画像生成AIワークフロー支援サイト「form-finder」からダウンロードできる。
https://cgworld.jp/flashnews/01-202507-RealEarth-Kontext.html