iPentec.com / Doc / 画像生成 / Stable Diffusion / Stable Diffusion Prompt

1 概要
2 難しいポイント
3 SDXL
- 3.1 プロンプト
- 3.2 実行結果
  - 3.2.1 SDXL v1.0
  - 3.2.2 Counterfeit XL v1.0
  - 3.2.3 Animagine XL v3.0
  - 3.2.4 Animagine XL v1.0
  - 3.2.5 blue_pencil-XL v0.3.1
  - 3.2.6 BreakDomainXL v03d
  - 3.2.7 DreamShaper XL1.0 alpha2
  - 3.2.8 Kohaku-XL alpha 7
  - 3.2.9 SDXL_Niji v5.1
  - 3.2.10 SDVN7-NijiStyleXL v1.0
  - 3.2.11 Nutmeg Mix v1.0
  - 3.2.12 Reproduction
  - 3.2.13 Stable-Diffusion-XL-Anime
  - 3.2.14 SDXL Yamer's Anime Ultra Infinity v3
  - 3.2.15 参考:SDXL (Real)
4 Stable Diffusion 1.5
- 4.1 プロンプト
- 4.2 実行結果
  - 4.2.1 Counterfeit v3
  - 4.2.2 MeinaMix v11
  - 4.2.3 Hassaku v1.3
  - 4.2.4 Blazing Drive v08
  - 4.2.5 Aing Diffusion v9.2
5 MidJourney NijiJourney
- 5.1 MidJourney
- 5.2 NijiJourney v6
- 5.3 NijiJourney v5
6 Bing Image Creator (DALL-E 3)
7 まとめ

Web検索はbingがおすすめ!

バイオリンを弾く画像を生成するプロンプト - Stable Diffusion

バイオリンを弾く画像を生成するプロンプトの紹介です。

概要

AI画像生成の中でも難しめなバイオリンを弾くプロンプトを試します。

難しいポイント

バイオリンを顎で挟む構図
バイオリンの向きの正しさ
バイオリンの大きさ (アニメ絵なので多少誇張して大きくなってもよい)
バイオリンの弓の本数
バイオリンの弓を握れるか
バイオリンの弓を握る位置
全体としてかっこよく描画できるか

など、難しいポイントが多めの題材です。

SDXL

プロンプト

バイオリンを弾くプロンプトは次のプロンプトで対応できます。

playing violin

または

playing instrument, violin

他の要素と組み合わせて、今回は以下のプロンプトで実行します。

Prompt

Prompt: best quality, highres, anime, anime style, playing violin, closed eyes,upper body
Negative prompt: worst quality, low quality
Settings: Steps: 20, Sampler: DPM++ 2M SDE Karras, CFG scale: 7, Size: 1024x1024

実行結果

SDXL v1.0

いい感じに出力されます。7割程度は弓が二本になったり、弓を握れていない、弓が途中で切れているなどしています。

Counterfeit XL v1.0

雰囲気的には良い感じですが、7割程度は弓が二本になったり、弓を握る位置が違っていたり、弓が途中で切れていたりしています。

Animagine XL v3.0

表情やポーズはとても良いです。弓もv1と比べると正確さが上がっていますが、うまく弓を持てていないケースがかなりあります。

Animagine XL v1.0

表情やポーズはとても良いのですが、バイオリンの位置が違ったり、バイオリンの向きが違ったりしており、9割は要修正です。

blue_pencil-XL v0.3.1

半分程度は正確に出力できているように見えます。ほかのモデルよりも正確性が高いです。ポーズがややおとなしめなので、かっこよさがもっと出ているといいなと思います。
"dynamic pose"などのプロンプトを入れると変わるかもしれません。

BreakDomainXL v03d

7割程度はバイオリンの向きが違ったり、弓が二本になったり、弓を握る位置が違っていたり、弓が途中で切れていたりしています。

DreamShaper XL1.0 alpha2

7割程度はバイオリンの向きが違ったり、弓が二本になったり、弓を握る位置が違っていたり、弓が途中で切れていたりしています。

Kohaku-XL alpha 7

6割程度はバイオリンの向きが違ったり、弓が二本になったり、弓を握る位置が違っていたり、弓が途中で切れていたりしています。ほかのモデルより若干正確度が高いように見えます。

SDXL_Niji v5.1

8割程度はバイオリンの向きが違ったり、弓が二本になったり、弓を握る位置が違っていたり、弓が途中で切れていたりしています。

SDVN7-NijiStyleXL v1.0

半分程度は正確に出力できているように見えます。ほかのモデルよりも正確性が高いです。
かっこいい感じのポーズで出力できています。

Nutmeg Mix v1.0

半分弱は正確に出力できているように見えます。ポーズはややおとなしめです。

Reproduction

6割ほどがバイオリンの向きが違ったり、弓が二本になったり、弓を握る位置が違っていたり、弓が途中で切れていたりしています。
ポーズは良い感じです。

Stable-Diffusion-XL-Anime

バイオリン演奏画像の正確さでの成功率は低めです。絵柄の振れ幅が大きいです。

SDXL Yamer's Anime Ultra Infinity v3

8割程度はバイオリンの向きが違ったり、弓が二本になったり、弓を握る位置が違っていたり、弓が途中で切れていたりしています。

参考:SDXL (Real)

アニメ絵のため、生成結果が悪いわけではなく、実写イメージの生成でも、同じような崩れは発生します。

Stable Diffusion 1.5

プロンプト

バイオリンを弾くプロンプトは次のプロンプトで対応できます。

playing violin

他の要素と組み合わせて、今回は以下のプロンプトで実行します。

Prompt

Prompt: best best quality, highres, playing violin, closed eyes,upper body
Negative prompt: worst quality, low quality
Settings: Steps: 20, Sampler: DPM++ 2M SDE Karras, CFG scale: 7, Size: 512x512