Animagine XL のQuality Modifiers, Aesthetic Tags の違いによる出力の違いの比較 - Stable Diffusion
Animagine XL のQuality Modifiers, Aesthetic Tags の違いによる出力の違いの比較をします。
概要
Animagine XL では、従来からある Quality Modifiers 以外に Aesthetic Tags が導入されています。
同じプロンプトで、Quality Modifiers や Aesthetic Tagsを変化させることで出力にどのような違いがあるかを確認します。
導入されている Special Tags
Quality Modifiers
リリースノートによると、Quality Modifiersは画像のスコアと閲覧者からの評価を考慮してスコア付けされているポイントとされています。
以下のタグが設定されています。
Quality Modifier(タグ) Score Criterion (スコアの範囲)
masterpiece > 95%
best quality > 85% & ≤ 95%
great quality > 75% & ≤ 85%
good quality > 50% & ≤ 75%
normal quality > 25% & ≤ 50%
low quality > 10% & ≤ 25%
worst quality ≤ 10%
Aesthetic Tags
リリースノートによると、視覚的な魅力に基づいてコンテンツの分類をしたとあります。
「視覚的に魅力的である」ということですが、主観的な要素もあり、今回どのような違いが出るかを確認します。
以下のタグが設定されています。
Aesthetic Tag(タグ) Score Range (スコアの範囲)
very aesthetic > 0.71
aesthetic > 0.45 & < 0.71
displeasing > 0.27 & < 0.45
very displeasing ≤ 0.27
Year Modifier
リリースノートによると、年代を指定してその時代のスタイルを出力できるとあります。
以下のタグが設定されています。
Year Tag(タグ) Year Range (スコアの範囲)
newest 2021 to 2024
recent 2018 to 2020
mid 2015 to 2017
early 2011 to 2014
oldest 2005 to 2010
Rating Modifiers
センシティブ画像に関する以下のタグが設定されています。
Rating Modifier(タグ) Rating Criterion (レーティング)
safe General
sensitive Sensitive
nsfw Questionable
explicit, nsfw Explicit
出力画像の比較:Quality Modifiers
次のプロンプトを利用して、Quality Modifiersの違いを比較します。
Prompt1
Prompt: 1girl, orange jacket, black pants, CS Shot, dynamic posing, simple background, (品質タグ)
Negative prompt: (なし)
Sampling method: Euler a
Prompt2
Prompt: 1girl, orange jacket, black pants, CS Shot, dynamic posing, simple background, (品質タグ)
Negative prompt: (品質タグに設定した以外のタグを記述)
Sampling method: Euler a
品質タグ:なし
品質タグがない状態の出力です。こちらが基準になります。
品質タグ:masterpiece
masterpieceを指定した出力です。なしの場合より品質が良く見えます。
Prompt1
Prompt2
品質タグ:best quality
best qualityを指定した出力です。なしの場合より品質が良く見えます。
Prompt1
Prompt2
品質タグ:great quality
great qualityを指定した出力です。なしの場合より品質が良いですが、masterpieceやbest qualityよりは品質が低く見えます。
Prompt1
Prompt2
品質タグ:good quality
great qualityを指定した出力です。怪しい出力もぼちぼち出てきます。
Prompt1
Prompt2
品質タグ:normal quality
normal qualityを指定した出力です。品質は下がってきています。
Prompt1
Prompt2
品質タグ:low quality
low qualityを指定した出力です。
Prompt1
Prompt2
品質タグ:worst quality
worst qualityを指定した出力です。
Prompt1
Prompt2
評価・所感
品質タグを変化させると、品質が変化する状況が確認できました。
今回masterpieceを指定した場合でも、Prompt1では、やや崩れる画像が出力されていますが、これは、low quality や worst quality の
学習結果が影響している可能性が考えられます。品質を上げた状態で安定させたい場合には、Prompt2のように、
ネガティブプロンプトにlow quality,worst qualityなどの低品質を除外するタグを指定したほうが出力結果が良くなります。
出力画像の比較:Aesthetic Tags
続いて、次のプロンプトを利用してAesthetic Tagsの違いを比較します。
プロンプトにQuality Modifiersの上位3つ
worst quality, low quality, normal quality
を入れ、
ネガティブプロンプトにQuality Modifiersの下位3つ
worst quality, low quality, normal quality
を入れ、クオリティは高い状態の出力にしたうえで、
Aestheticタグを変化させて違いを確認します。
Prompt1
Prompt: 1girl, orange jacket, black pants, CS Shot, dynamic posing, simple background, masterpiece, best quality, great quality, (Aestheticタグ)
Negative prompt: worst quality, low quality, normal quality
Sampling method: Euler a
Prompt2
Prompt: 1girl, orange jacket, black pants, CS Shot, dynamic posing, simple background, masterpiece, best quality, great quality, (Aestheticタグ)
Negative prompt: worst quality, low quality, normal quality, (Aestheticタグに指定した以外のAesthenticタグ)
Sampling method: Euler a
Aestheticタグ:なし
Aestheticタグの指定がない場合の出力です。こちらが基準になります。
Aestheticタグ:very aesthetic
very aestheticを指定した場合の出力です。タグなしと比較すると、画面にキャラクターが大きく描かれており、余白が少ない印象を受けます。
Prompt1
Prompt2
Aestheticタグ:aesthetic
aestheticを指定した場合の出力です。very aestheticと比較するとキャラクターがやや小さく描かれ、余白が若干多い印象があります。
Prompt1
Prompt2
Aestheticタグ:displeasing
displeasingを指定した場合の出力です。稀ですが、キャラクターの体が崩れた画像が生成される場合があります。
ペイントがaesthetic, very aestheticと比較すると、若干フラット感がある印象です。
Prompt1
Prompt2
Aestheticタグ:very displeasing
very displeasingを指定した場合の出力です。キャラクターの体が崩れた画像が生成される場合があります。
ペイントは立体感が抑えられ、フラット感がある印象です。
Prompt1
Prompt2
評価・所感
Aestheticタグを変化させると出力画像にある程度の変化があることが確認できました。
displeasing, very displeasingを指定すると、塗りは立体感が弱くなりフラット感のあるペイントになる印象です。
また、低頻度ですが、キャラクターの体が崩れる場合があることが確認できました。
displeasing, very displeasingが美的に劣るかという点については、何とも言えないですが、very aestheticを指定した場合の
立体感のあるペイントのほうがペインティングの手間はかかっている印象を受けます。
出力画像の比較:Year Modifier
次のプロンプトを利用して、Year Modifiersの違いを比較します。
Prompt1
Prompt: 1girl, orange jacket, black pants, CS Shot, dynamic posing, simple background, masterpiece, best quality, great quality, (Year Modifiersタグ)
Negative prompt: worst quality, low quality, normal quality
Sampling method: Euler a
Prompt2
Prompt: 1girl, orange jacket, black pants, CS Shot, dynamic posing, simple background, masterpiece, best quality, great quality, (Year Modifiersタグ)
Negative prompt: worst quality, low quality, normal quality, (Year Modifiersタグに指定しなかったタグ)
Sampling method: Euler a
Year Modifiersタグ:なし
Year Modifiersタグを指定しない場合の出力です。こちらが基準になります。
Year Modifiersタグ:newest
newestを指定した場合の出力です。他の出力と比較すると、頬の赤みが強い印象と光沢感の表現が若干強めの印象があります。
また、顎が細く鋭い印象を受けます。
Prompt1
Prompt2
Year Modifiersタグ:recent
recentを指定した場合の出力です。
Prompt1
Prompt2
Year Modifiersタグ:mid
midを指定した場合の出力です。newestやrecentと比較すると、若干色が淡いものと、彩度の高いものがある印象を受けます。
Prompt1
Prompt2
Year Modifiersタグ:early
earlyを指定した場合の出力です。newestやrecentと比較するとややフラット感がある印象です。
彩度の高い画像の出力も目につきます。
若干絵柄の変化も見られます。
Prompt1
Prompt2
Year Modifiersタグ:oldest
oldestを指定した場合の出力です。oldestでは、絵柄の変化も見られ、レトロ感のあるキャラクターの絵がの出力になります。
フラット感が高いペイントが多く、彩度の高い画像の出力も見られます。使用している色数を抑える傾向もありそうです。
Prompt1
Prompt2
評価・所感
Year Modifiersタグを変化させると出力画像にある程度の変化があることが確認できました。
古い年代を指定するとフラット感が若干高まる印象です。また、oldestを指定すると絵柄の変化も見られます。
midやearlyではまつ毛の表現が控えめになっており、全体的に華やかさが抑えられた絵柄になる傾向があります。
著者
iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。