国産のAI画像生成サービス「AI Picasso」や「AI素材.com」を運営するAI Picasso株式会社は12月16日(月)、イラストやアニメ、マンガといったAIアート生成に特化した画像生成AI「Emi 3(Ethereal master of illustration 3)」を商用利用可能で無償公開した。Hugging Faceからのモデルのダウンロード(推奨)、またはWeb上のデモを利用できる。

  • positive: 1girl with the speech bubble saying "Happy Holidays!", upper body, sivler short hair, blue eyes, warm wear, outdoor, snow
    negative: photo
  • positive: manga style, monochrome, an aerial view of Tokyo's cityscape. The scene captures the sunset view with dense clusters of modern skyscrapers in Shinjuku and Shibuya. The intricate network of illuminated streets and highways is visible, showcasing the unique landscape where traditional low-rise buildings coexist with contemporary architecture. Mount Fuji's silhouette can be seen in the distant background, while soft evening lights from office buildings and streets envelop the entire city. The image should be ultra high-resolution and photorealistic, composed as if shot with a wide-angle lens from approximately 1,000 feet altitude. 
    negative:
positive: Full body shot of a mysterious teenage boy in anime style, with wild spiky red and orange hair that seems to flicker like flames. He's wearing a black sleeveless top with red accents and dark baggy pants with flame patterns along the hem. His amber eyes glow with inner fire, and wisps of flame dance around his outstretched hands. His pose is dynamic, suggesting movement, with one hand raised commanding the fire. The lighting is dramatic, with the flames he controls casting warm orange light across his determined expression. The art style is clean and sharp, reminiscent of modern action anime. Background shows subtle smoke effects and ember particles floating in the air."
negative: photo, bad hands, bad anatomy, low quality

Emi 3は オプトアウト済みモデルのStable Diffusion 3.5 LargeをベースにAI Picassoが開発した画像生成AI。学習データは、Stable Diffusionと同様のデータセットからDanbooruの無断転載画像を取り除いて手動で集めた約3,000枚の画像と、Stable Diffusionと同様のデータセットからDanbooruの無断転載画像を取り除いて自動で集めた約40万枚の画像。無断転載画像からの追加学習は行われておらず、ダウンロードできるEmi 3のモデルは日本の著作権法に基づいて合法とされる。

基盤モデルがSD 3.5 Largeであることから、約200単語までのプロンプト入力が可能となる。AnimagineXLと同じプロンプトを使用することができるほか、プロンプトの洗練にはChatGPTを用いることが推奨されている。

なお、人間の手を綺麗に生成することが難しいほか、イラストなどとは対極にあるフォトリアルな画像生成には向かないとする。Emi 3のモデルは、ComfyUIによる使用が推奨されている。

■Stable Diffusion 3.5 Large : Colab / ComfyUI による高品質な画像生成(ComfyUIのインストールについての参照記事)
https://tensorflow.classcat.com/2024/10/23/sd35-large-colab-comfyui/

■商用利用ができる表現能力が高いAIアート用画像生成AI、Emi 3を無償公開(note)
https://note.com/aipicasso/n/nb1d0fa67bbcc

CGWORLD関連情報

●動画生成AI「Pika 2.0」リリース! アップロードした複数の画像とテキストプロンプトを材料にシーンを生成する「Scene Ingredients」を搭載

Mellis社は動画生成AI「Pika 2.0」をリリース。アップロードした複数の画像とテキストプロンプトを材料(Ingredient)にしてシーンを生成できる「Scene Ingredients」機能を搭載し、従来よりも生成動画のコントロール性が向上した。
https://cgworld.jp/flashnews/202412-Pika20.html

●動画生成AIは1年半でここまで来た! Alex Patrascu氏が昨年制作のAIショートフィルムをOpenAI「Sora」のRemix機能でリマスター

AIを活用したコンテンツ制作を行うクリエイティブスタジオ、MASSIVE STUDIOの創業者のひとり、Alex Patrascu氏が、2023年7月末にRunway社・Gen-2を使用して制作した作品を、先日一般公開されたOpenAI社・SoraのRemix機能を用いてリマスターしたAIショートフィルム『Nexus: Hive Mind』を投稿した。
https://cgworld.jp/flashnews/202412-Patrascu-Sora-Film.html

●OpenAIの動画生成AI「Sora」一般公開! 有料プランで最大1080p・20秒の動画を月500本まで生成可能

OpenAI社が動画生成AI「Sora(ソラ)」をリリース。動画生成にあたってはプロンプトの編集が行えるだけでなく、生成した動画に対してRe-Cut、Remix、Blend、Loopという4種の編集ツールが利用できるほか、台本の作成と編集により生成動画の調節が可能な「Storyboard」機能も用意されている。
https://cgworld.jp/flashnews/202412-OpenAI-Sora.html