Animagine XL のQuality Modifiers, Aesthetic Tags の違いによる出力の違いの比較 - Stable Diffusion

Animagine XL のQuality Modifiers, Aesthetic Tags の違いによる出力の違いの比較をします。

概要

Animagine XL では、従来からある Quality Modifiers 以外に Aesthetic Tags が導入されています。 同じプロンプトで、Quality Modifiers や Aesthetic Tagsを変化させることで出力にどのような違いがあるかを確認します。

導入されている Special Tags

Quality Modifiers

リリースノートによると、Quality Modifiersは画像のスコアと閲覧者からの評価を考慮してスコア付けされているポイントとされています。 以下のタグが設定されています。

Quality Modifier(タグ) Score Criterion (スコアの範囲)
masterpiece > 95%
best quality > 85% & ≤ 95%
great quality > 75% & ≤ 85%
good quality > 50% & ≤ 75%
normal quality > 25% & ≤ 50%
low quality > 10% & ≤ 25%
worst quality ≤ 10%

Aesthetic Tags

リリースノートによると、視覚的な魅力に基づいてコンテンツの分類をしたとあります。 「視覚的に魅力的である」ということですが、主観的な要素もあり、今回どのような違いが出るかを確認します。
以下のタグが設定されています。

Aesthetic Tag(タグ) Score Range (スコアの範囲)
very aesthetic > 0.71
aesthetic > 0.45 & < 0.71
displeasing > 0.27 & < 0.45
very displeasing ≤ 0.27

Year Modifier

リリースノートによると、年代を指定してその時代のスタイルを出力できるとあります。
以下のタグが設定されています。

Year Tag(タグ) Year Range (スコアの範囲)
newest 2021 to 2024
recent 2018 to 2020
mid 2015 to 2017
early 2011 to 2014
oldest 2005 to 2010

Rating Modifiers

センシティブ画像に関する以下のタグが設定されています。

Rating Modifier(タグ) Rating Criterion (レーティング)
safe General
sensitive Sensitive
nsfw Questionable
explicit, nsfw Explicit

出力画像の比較:Quality Modifiers

次のプロンプトを利用して、Quality Modifiersの違いを比較します。
Prompt1
Prompt: 1girl, orange jacket, black pants, CS Shot, dynamic posing, simple background, (品質タグ)
Negative prompt: (なし)
Sampling method: Euler a
Prompt2
Prompt: 1girl, orange jacket, black pants, CS Shot, dynamic posing, simple background, (品質タグ)
Negative prompt: (品質タグに設定した以外のタグを記述)
Sampling method: Euler a

品質タグ:なし

品質タグがない状態の出力です。こちらが基準になります。

品質タグ:masterpiece

masterpieceを指定した出力です。なしの場合より品質が良く見えます。
Prompt1
Prompt1

Prompt2
Prompt2

品質タグ:best quality

best qualityを指定した出力です。なしの場合より品質が良く見えます。
Prompt1
Prompt1

Prompt2
Prompt2

品質タグ:great quality

great qualityを指定した出力です。なしの場合より品質が良いですが、masterpieceやbest qualityよりは品質が低く見えます。
Prompt1
Prompt1

Prompt2
Prompt2

品質タグ:good quality

great qualityを指定した出力です。怪しい出力もぼちぼち出てきます。
Prompt1
Prompt1

Prompt2
Prompt2

品質タグ:normal quality

normal qualityを指定した出力です。品質は下がってきています。
Prompt1
Prompt1

Prompt2
Prompt2

品質タグ:low quality

low qualityを指定した出力です。
Prompt1
Prompt1

Prompt2
Prompt2

品質タグ:worst quality

worst qualityを指定した出力です。
Prompt1
Prompt1

Prompt2
Prompt2

評価・所感

品質タグを変化させると、品質が変化する状況が確認できました。 今回masterpieceを指定した場合でも、Prompt1では、やや崩れる画像が出力されていますが、これは、low quality や worst quality の 学習結果が影響している可能性が考えられます。品質を上げた状態で安定させたい場合には、Prompt2のように、 ネガティブプロンプトにlow quality,worst qualityなどの低品質を除外するタグを指定したほうが出力結果が良くなります。

出力画像の比較:Aesthetic Tags

続いて、次のプロンプトを利用してAesthetic Tagsの違いを比較します。
プロンプトにQuality Modifiersの上位3つ worst quality, low quality, normal quality を入れ、 ネガティブプロンプトにQuality Modifiersの下位3つ worst quality, low quality, normal quality を入れ、クオリティは高い状態の出力にしたうえで、 Aestheticタグを変化させて違いを確認します。
Prompt1
Prompt: 1girl, orange jacket, black pants, CS Shot, dynamic posing, simple background, masterpiece, best quality, great quality, (Aestheticタグ)
Negative prompt: worst quality, low quality, normal quality
Sampling method: Euler a
Prompt2
Prompt: 1girl, orange jacket, black pants, CS Shot, dynamic posing, simple background, masterpiece, best quality, great quality, (Aestheticタグ)
Negative prompt: worst quality, low quality, normal quality, (Aestheticタグに指定した以外のAesthenticタグ)
Sampling method: Euler a

Aestheticタグ:なし

Aestheticタグの指定がない場合の出力です。こちらが基準になります。

Aestheticタグ:very aesthetic

very aestheticを指定した場合の出力です。タグなしと比較すると、画面にキャラクターが大きく描かれており、余白が少ない印象を受けます。
Prompt1
Prompt1

Prompt2
Prompt2

Aestheticタグ:aesthetic

aestheticを指定した場合の出力です。very aestheticと比較するとキャラクターがやや小さく描かれ、余白が若干多い印象があります。
Prompt1
Prompt1

Prompt2
Prompt2

Aestheticタグ:displeasing

displeasingを指定した場合の出力です。稀ですが、キャラクターの体が崩れた画像が生成される場合があります。 ペイントがaesthetic, very aestheticと比較すると、若干フラット感がある印象です。
Prompt1
Prompt1

Prompt2
Prompt2

Aestheticタグ:very displeasing

very displeasingを指定した場合の出力です。キャラクターの体が崩れた画像が生成される場合があります。 ペイントは立体感が抑えられ、フラット感がある印象です。
Prompt1
Prompt1

Prompt2
Prompt2

評価・所感

Aestheticタグを変化させると出力画像にある程度の変化があることが確認できました。 displeasing, very displeasingを指定すると、塗りは立体感が弱くなりフラット感のあるペイントになる印象です。 また、低頻度ですが、キャラクターの体が崩れる場合があることが確認できました。
displeasing, very displeasingが美的に劣るかという点については、何とも言えないですが、very aestheticを指定した場合の 立体感のあるペイントのほうがペインティングの手間はかかっている印象を受けます。

出力画像の比較:Year Modifier

次のプロンプトを利用して、Year Modifiersの違いを比較します。
Prompt1
Prompt: 1girl, orange jacket, black pants, CS Shot, dynamic posing, simple background, masterpiece, best quality, great quality, (Year Modifiersタグ)
Negative prompt: worst quality, low quality, normal quality
Sampling method: Euler a
Prompt2
Prompt: 1girl, orange jacket, black pants, CS Shot, dynamic posing, simple background, masterpiece, best quality, great quality, (Year Modifiersタグ)
Negative prompt: worst quality, low quality, normal quality, (Year Modifiersタグに指定しなかったタグ)
Sampling method: Euler a

Year Modifiersタグ:なし

Year Modifiersタグを指定しない場合の出力です。こちらが基準になります。

Year Modifiersタグ:newest

newestを指定した場合の出力です。他の出力と比較すると、頬の赤みが強い印象と光沢感の表現が若干強めの印象があります。 また、顎が細く鋭い印象を受けます。
Prompt1
Prompt1

Prompt2
Prompt2

Year Modifiersタグ:recent

recentを指定した場合の出力です。
Prompt1
Prompt1

Prompt2
Prompt2

Year Modifiersタグ:mid

midを指定した場合の出力です。newestやrecentと比較すると、若干色が淡いものと、彩度の高いものがある印象を受けます。
Prompt1
Prompt1

Prompt2
Prompt2

Year Modifiersタグ:early

earlyを指定した場合の出力です。newestやrecentと比較するとややフラット感がある印象です。 彩度の高い画像の出力も目につきます。 若干絵柄の変化も見られます。
Prompt1
Prompt1

Prompt2
Prompt2

Year Modifiersタグ:oldest

oldestを指定した場合の出力です。oldestでは、絵柄の変化も見られ、レトロ感のあるキャラクターの絵がの出力になります。 フラット感が高いペイントが多く、彩度の高い画像の出力も見られます。使用している色数を抑える傾向もありそうです。
Prompt1
Prompt1

Prompt2
Prompt2

評価・所感

Year Modifiersタグを変化させると出力画像にある程度の変化があることが確認できました。
古い年代を指定するとフラット感が若干高まる印象です。また、oldestを指定すると絵柄の変化も見られます。 midやearlyではまつ毛の表現が控えめになっており、全体的に華やかさが抑えられた絵柄になる傾向があります。
著者
iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。
掲載日: 2024-03-22
iPentec all rights reserverd.