アニメ / イラスト系 モデルの違いによる出力イメージの比較 (SDXL) - Stable Diffusion
Stable Diffusion XL (SDXL)のアニメ / イラスト系 モデルの違いによる出力イメージの比較の紹介です。
概要
同じプロンプトでモデルを変更してどのような画像が生成されるかを比較します。
シンプルなプロンプトで基本的な絵柄や描線の表現を確認するため、今回の比較では、以下のプロンプトを利用します。
Stable Diffusion 1.5 / 2.1 の場合は "kawaii" はありませんでしたが、SDXLの場合、イラスト系モデルであっても、プロンプトで明示しないとリアルな画像が出力されるため、
best quality, kawaii, illustration
をプロンプトに追加しています。
ただし、新しいモデルでは"kawaii"が無くてもイラスト的画像が出力されるため、新しいモデルでの利用の場合は無いほうが適切な画像が生成されます。
このページでは旧モデルからの比較のため、"kawaii"をつけたままとしています。
Prompt1
Prompt: best quality, kawaii, illustration, 1girl, plain blue t-shirt, black short pants, standing, upper thigh
Negative prompt: worst quality, low quality
Settings: Steps: 20, Sampler: Euler a, CFG scale: 7, Size: 768x1,024
SDXLではプロンプトの理解力が上がったとのことで、こちらのプロンプトでもテストをします。縦横サイズがかなり意地悪な設定です。
Prompt2
Prompt: boy meets girl, cybermetrics metal android girl, teenage human boy, city from high position background, anime shading, daytime scene,highres, best quality
Negative prompt: worst quality, low quality
Settings: Steps: 20, Sampler: Euler a, CFG scale: 7, Size: 1,536x640 (一部モデルは 1,024x512)
チェックするポイント
絵柄
リアルよりなのか、デフォルメが強いのかを確認します。絵柄はLoRAで変えられますがモデルの基本的な絵柄の影響は大きいです。
輪郭線
輪郭線の印象がどの程度強いかを確認します。リアルなモデルほど輪郭線が目立たなくなり、
デフォルメの強いモデル(アニメ漫画スタイル)は輪郭線がしっかりと描かれる傾向にありますが
モデルにより輪郭線の描画に違いがあります。
露出度
Stable Diffusion 1.5ではシャツの丈が短い画像が生成され、へそを出す画像が出力される傾向にありましたが、
SDXLのモデルでは、露出が控えめのためへそが見える画像を出力するケースは少ないです。
プロンプトの表現力
Prompt2では "boy meets girl", "cybermetric metal android girl" などやや難しめの語句を入力しています。これらのプロンプトがどう表現されるかを確認します。
構図
全身を描きたがるか、プロンプト通り腿から上を描くかの違いがモデルによって異なります。
また、ポーズの振れ幅が大きいか、通常の立ちポーズか、モデル写真のような決めポーズが多いかも確認ポイントです。
グラデーションの多い少ない
アニメ塗りでシャープに塗分けるか、グラデーションを多用して滑らかに塗分けるかの違いがモデルごとにあります。
ハイライトの表現
どの程度強いハイライトを描画するかを確認します。
画像の振れ幅
プロンプトでの表現があいまいな場合にどの程度の振れ幅で出力するかを確認します。今回 "blue shirt" を指定していますが、
青色も水色から、黒に近い藍色まで様々な青色があるため、出力ごとに色の違いがあるはずです。
モデルにより青の解釈や振れ幅が違いますので、その違いを確認します。
振れ幅は大小どちらにもメリットがあり、大きいほうが出力のバリエーションが幅広くなるため、アイディア出しや構想での用途に適しています。
一方で、複数の静止画から動画を作成する場合や、同じキャラクターをポーズを変えながら、複数生成したい場合には振れ幅の少ないほうが適しています。
背景
今回のプロンプトでは背景に関する指定がありませんが、何も指定しない場合、どのような背景が描画されるかを確認します。
用途によっては背景が無い場合が望ましい場合もあります。
Animagine XL v3.1
シャツは水色で安定します。全体的にやや淡いカラーでの出力になります。v3.0よりフラット感が強い出力になります。
パンツはプロンプト通りに短パンでの出力となりますが稀にロングのパンツの出力もあります。レギンス形状の出力もあります。
髪の毛はやや長めのショートヘアで安定します。
髪色は、茶色みのある黒髪、または水色髪のどちらかになる傾向です。
v3.0と異なり、フォーカスがキャラクタではなく、衣類に合う場合があります。
Prompt2も背景のフラット感がv3.0より強い印象です。全体を通して、若干ステップ数が不足しているような印象もあります。
また、このプロンプトではわかりにくいですが、Anime Shading, Anime Styleには強く反応し、ワードがある場合はフラットなアニメ塗りの出力になります。
また、プロンプトにmasterpiece, best quality などの品質タグがない場合の画像出力の品質は従来モデルよりかなり下がる印象があります。
また、v3.1はセル塗りのアニメ絵に特化している傾向があり、イラスト的な画像やややリアリティのある画像を生成する場合はv3.0のほうが適している印象もあります。
Prompt2 Step30
旧バージョンは
こちら
バージョン3系の比較は
こちら
BluePencil XL v7.0.0
シャツは明るい水色で安定します。パンツはタイトな短パン形状の出力が多いです。稀に長い丈のパンツが出力される場合もあります。
シャツのセンターにプリント柄が入る場合が多いです。
髪の毛の色は黒髪がほとんどを占めます。水色髪の出力もある程度あります。髪の毛の長さはショートヘアーで安定します。
髪の毛のハイライトは比較的描画されます。グラデーション表現による光沢感は控えめの印象です。衣類の光沢感の表現もあります。
輪郭線は線の色が濃いため、やや目立つ仕上がりです。
v6.0.0と比較すると、彩度が上がり鮮やかなカラーリングになる傾向です。背景の描画も詳細です。
旧バージョンは
こちら
anima_pencil-XL v5.0.0
シャツはやや濃い水色、または明るい水色の出力になります。中央にプリントが入る場合が多いです。
パンツはややタイトな短パン形状の出力が多いです。稀にレギンス形状のパンツが出力されます。加えて、長い丈のパンツが出力される率がやや高いです。
髪の毛の色は青髪、水色髪、がほとんどを占めます。
輪郭線は線は細めですが、色が濃いこともあり、やや目立つ仕上がりです。BluePencilと比較するとPrompt1では全身を描画する率が高く、カラーリングがわずかに淡い印象があります。
Prompt2は彩度が低い画像が出力されますが、背景の精密感やプロンプトの反映度は高い印象です。
Swamp Machine v3.0
シャツは水色またはやや濃い水色になります。低い頻度でシャツにワンポイントが入ります。
パンツは短パンでの出力となります。レギンス形状の出力もあります。髪の毛はショートヘアで安定します。髪色は、黒髪になります。
v2.0や他のモデルと比較すると、フラット感の強い生成結果になります。
なお、プロンプトを変更してmasterpieceを含めるとフラット感の強い生成結果では無くなります。
Prompt
Prompt: 1girl, plain blue t-shirt, black short pants, standing, upper thigh, very aesthetic, amazing quality, best quality
Negative prompt: (worst quality, low quality:1.2)
旧バージョンは
こちら
Counterfeit XL v2.5
シャツは水色で安定します。シャツは無地のものが多いです。
髪の毛はショートカットヘアが多めですが、ロングヘアの出力もあります。
髪色はピンク髪が多くなりますが、青髪や黒髪、茶髪が低頻度で出力されます。
パンツはショートパンツではなくロングの形状になります。ショートパンツの出力はありません。
ショートパンツの出力にならないなど、プロンプトに従わないケースがかなり多い印象です。v2.0の特徴であった全体が赤みのある画像になる傾向は無くなっています。
"Kawaii"のプロンプトに強く反応し、かわいい感じの画像が出力されます。
"Kawaii"を抜くと下図の出力になります。v2.0と異なり直立に近い立ちポーズが出力されます。
Prompt2の出力は下図です。四つ這いになるポーズが出力されます。
"cybermetrics"を抜くと四つ這いのポーズはなくなります。ちょっとしたプロンプトのワードが大きな影響を与えるようです。
旧バージョンは
こちら
stable-diffusion-xl-anime-final
シャツは明るい水色でほぼ変化しないです。シャツにはプリント柄が入る場合がやや多いです。
パンツはややタイトな短パン形状です。レギンスに近い形状のものが出力される場合もあります。髪の毛はショートヘアが大半を占めますが、ツインテールやロングヘアの出力も稀にあります。
髪の毛のハイライトは比較的しっかり描画されます。衣類の光沢も入る場合があります、輪郭線の色は黒に近くかなり目立つ輪郭線です。
Prompt2ではやや赤みがかかる印象です。
Reproduction | SDXL 2v1.2
シャツは明るい水色で安定します。中心にプリント柄のあるシャツがやや多めの印象です。パンツはややタイトな短パン形状の出力が多いです。
長い丈のパンツやレギンス形状のパンツも少数ですが出力されます。
髪の毛はショートヘアーが多めになります。髪の毛の色は黒髪がやや多めですが、銀髪や白髪、薄い金髪も出力されバリエーションは多いです。
髪の毛のハイライトは描画されますが控えめな印象です。衣類の光沢感の表現はわずかに入ります。
輪郭線は塗りの色より濃い色で表現され、やや目立つ仕上がりになります。
旧バージョンは
こちら
BreakDomain XL V08q
シャツは濃い目の明るい水色で安定します。パンツはややタイトな短パン形状の出力が多いです。
髪色は青みのあ黒髪がほとんどを占めます。茶色みのある黒髪も出力されます。
髪の毛のハイライトはやや控えめの描画です。グラデーションによる光沢感も控えめです。
輪郭線は塗りの色より濃い色で描画されますが、線自体は細めのため、控えめな輪郭線です。
前バージョンと比較すると、画像全体の明るさが明るめになった印象です。また、キャラクターは頭身やデフォルメ度合いの振れ幅が安定している印象です。
彩度が高めな画像が出力される傾向にあります。
旧バージョンは
こちら
LS Vividus XL v3.0
シャツは薄めの水色がほとんどを占めます。髪の毛はショートヘアですが、肩まで届く長さになる場合もあります。
髪色は青味のある黒髪が多いですが、金髪や水色髪も出力されます。パンツはややタイトな短パン形状で安定します。
髪の毛のハイライト表現は控えめです。衣類の光沢感の表現はありません。
SDXL Yamer's Anime Ultra Infinity v5
シャツは明るめの水色で安定します。パンツはややタイトな短パン形状で安定します。
髪の毛の色は、青みのある黒髪で安定します。まれに茶髪や金髪が出力されます。
髪の毛のハイライト表現はありますが、グラデーション表現は使われず控えめな印象です。衣類の光沢感の表現はありません。
v4までは、髪の色や背景などバリエーションに富んだ出力できしたが、v5では背景もほとんど描画されず、絵柄の振れ幅も少なくなり、
振れ幅が少ない画像出力になった印象です。v4より暖色系のトーンが減っている印象です。
旧バージョンは
こちら
Koharumix v1.0
シャツは明るい水色で安定します。稀に白色のシャツが出力されます。
パンツはややタイトな短パン形状がほとんどを占めますが、ゆとりのある短パン形状の出力もあります。
髪の毛の長さは、ロングヘアの出力が他のモデルより多めです。髪色はグレー(淡い黒髪)がほとんどを占めますが、低頻度で青髪や白髪、銀髪も出力されます。
輪郭線は塗りの色より濃い色で描画されるため、やや目立つ輪郭線です。
全体的に淡いカラーでの出力になります。
Prompt2の出力はアンドロイド、メカ要素がほとんど反映されていないです。
Hassaku (sdxl) betaV4
シャツは明るい水色がほとんどとなります。パンツはタイトな短パン形状が多いです。
髪の毛の長さはショートヘアがほとんどですが、ロングヘアがまれに出力されます。 髪の色は黒髪、青髪、金髪、銀髪、ピンク髪とバリエーションが豊富です。
ポージングのバリエーションも多く、プロンプト通りでないポージングが出力されるケースが稀ににあります。
v2より暖色系のカラーリングになります。
旧バージョンは
こちら
SDVN8 Base
シャツは明るい水色または青になります。パンツは若干のゆとりのある短パン形状で出力されます。
髪の毛の色は黒髪が多いですが、稀に金髪が出力されます。髪の毛の長さはショートヘアまたは、肩まで届く程度の長さになります。
全身を描画する傾向になります。
輪郭線は塗りの色より濃い色、または黒で描画されます。フラットな塗りのため輪郭線はかなり目立つ仕上がりです。
Prompt2ではフラット感が無くなり、水彩画風の仕上がりになります。
旧バージョンは
こちら
DarkPizza XL v4.0
全体が青みがかった独特なカラーリングで出力されます。
シャツは明るい青色が多いです。パンツはタイトな短パン形状で出力されます。
髪の毛の色は青みがかった黒髪が多いですが、茶髪や金髪も出力されます。髪の毛の長さはショートヘアが大半を占めますが、ロングヘアもまれに出力されます。
輪郭線は濃い色で描画され目立つ輪郭線です。
Himawarimix XL v13
シャツは明るい水色で安定します。中央にキャラクターのプリントが入る率が高いです。
パンツはタイトな短パン形状、レギンスタイプの出力があります。丈の長いパンツが出力される場合もあります。
髪の毛の色は黒髪が多いですが、水色髪、銀髪の出力が稀にあります。髪の毛の光沢はやや控えめです。衣類の光沢感の描画はわずかにあります。
輪郭線は細いですが、濃い色で描画されるため、やや目立ちます。
v6と比較すると背景が細部まで描画される傾向にあります。
旧バージョンは
こちら
NekoRayXL V0.6
シャツは明るい水色で安定します。全身を描画したがる傾向です。パンツはややタイトな短パン形状で出力されます。
髪の毛の色は青みのある黒髪が多いですが、青髪、金髪も出力されます。髪の毛の長さはショートヘアで安定します。
髪の毛の光沢は描画されますが、かなり控えめです。輪郭線は薄い色で描画されあまり目立たない仕上がりです。
Prompt2では人物が2人の出力で安定し、Boy meets girlの要素が表現されています。
プロンプトの反応が良くマイナーなワードでも他モデルと違う画像が生成されるため、幅広い画像を学習している印象です。
SSD-1B-anime v2
NekoRayXLを基にしているモデルのため、出力はNekoRayXLと似ています。
シャツは明るい水色で安定します。やや全身を描画したがる傾向です。パンツはややタイトな短パン形状で出力されます。
髪の毛の色は青みのある黒髪が多いですが、青髪、金髪も出力されます。髪の毛の長さはショートヘアで安定します。
髪の毛の光沢は描画されますが、かなり控えめです。輪郭線は薄い色で描画されあまり目立たない仕上がりです。
Prompt2では人物が3人の出力がまれにあります。NekoRayXLと比較してやや暗めの画像が出力されます。
旧バージョンは
こちら
AnimeXL-xuebiMIX v5.0
シャツは明るい水色で安定します。パンツはややタイトな短パン形状の出力が多いです。
髪の毛の色は黒髪で安定します。まれに金髪が出力される場合があります。髪の毛の長さはショートヘアで安定します。
髪の毛の光沢の描画は控えめです。衣類の光沢表現もありません。やや全身を描きたがる傾向にあります。
Prompt2では3人以上のキャラクター出力となっています。
出力画像のテイストがNekoRay XLと似ています。
Kohaku-XL Epsilon rev3
シャツの色は水色から濃い青までバリエーションがあります。パンツはタイトな短パン形状の出力が多いです。
髪の毛は黒髪が多いですが、ピンク髪の出力もあります。
光沢感の表現は無く、フラット感の強いペインティング結果になります。
旧バージョンは
こちら
Anime Illust Diffusion XL v0.8
シャツはくすんだ水色になります。背景はモスグリーン調になり、振れ幅が少ないです。
パンツは短パン形状または、膝丈のレギンスで出力されます。
髪の毛のカラーは黒髪が基本ですが、赤髪やピンク髪も出力されます。
塗分けはあまりされず、全体としてフラットな画像の出力です。輪郭線は比較的しっかりと描画されます。v7と比較すると、全体的にくすんだ色味の出力になります。
このモデルは"By"で開始する作風のトリガワードが別途用意されており、そのトリガワードと合わせて利用する方法が推奨されています。
旧バージョンは
こちら
HoloAnime-XL v2.7
シャツは明るい水色で安定します。パンツはややタイトな短パン形状の出力が多いです。
髪の毛の色は青みのある黒髪で安定します。髪の毛の長さはショートヘアで安定します。
髪の毛の光沢の描画は比較的しっかりと描画されます。グラデーション表現が若干使われ、光沢感の表現があります。衣類の光沢表現はありません。
出力画像に精密感やシャープさが少ないですが、ペイントに手塗り感があります。
Prompt2では、"boy meets girl" "Android"の両方を反映したイメージが出力できています。
X2 Anime M1
シャツは明るい水色で安定します。パンツはややタイトな短パン形状の出力が多いです。
髪の毛の色は水色髪と黒髪のどちらかの出力になりますが、金髪も低頻度で出力されます。髪の毛の長さはショートヘアで安定します。
髪の毛の光沢の描画は比較的強めに描画されます。グラデーション表現も使われ、光沢感の表現があります。衣類の光沢表現もあります。
やや水彩画をイメージさせるペインティングになります。
Prompt2では、"boy meets girl" "Android"の両方を反映したイメージが出力できています。
プロンプトの反応が良くマイナーなワードでも他モデルと違う画像が生成されるため、幅広い画像を学習している印象です。
SDXL-Deephentai-mix v1.3
シャツは明るい水色で安定します。パンツはややタイトな短パン形状の出力が多いです。
髪の毛の色は黒髪がほとんどですが、黒髪に近い茶髪や金髪がまれに出力されます。髪の毛の長さはショートヘアで安定します。
髪の毛の光沢の描画はやや控えめです。グラデーション表現も控えめです。
キャラクターはフラット感のある塗りです。
v1.2xとの比較では、Prompt2で背景の単調さが減り複雑な背景が描画できるようになった印象があります。
Osorubeshi XL Pastel_v2
シャツは明るい水色で安定します。パンツはややタイトな短パン形状の出力が多いです。
髪の毛の色は黒髪または、青髪が多いですが、白髪や水色髪も出力されバリエーションが多いです。髪の毛の長さはショートヘアで安定します。
髪の毛の光沢の描画は比較的しっかり描画されます。グラデーション表現は控えめです。
輪郭線は薄い色、かつ赤みのある色で描画されますが、塗りがフラットなこともあり比較的目立ちます。
Prompt2では、"boy meets girl" を反映したイメージが出力できています。
7th Anime XL A v1.0
シャツは明るい水色の出力が多いです。パンツはややタイトな短パンの形状とレギンス形状の両方が出力されます。
髪の毛の色は黒髪または、水色髪になります。稀に紫みのある髪色も出力されます。髪の毛の光沢の描画は控えめですが、しっかり描画されます。
衣類の光沢は描画される場合もあります。
グラデーション表現も控えめでシャープなアニメ塗りわけになります。Animagine XLより柔らかく暖かみのある出力結果の印象です。
7th Anime XL B v1.0
7th Anime XL Aと比較すると全体的に柔らかく、暖かみのあるカラーリングの仕上がりになります。
Prompt2では背景がAと比較すると霞んだ仕上がりになります。
Async's MIX XL v3.2
シャツは明るい水色で安定します。パンツはややタイトな短パン形状の出力、レギンス形状の両方があります。。
髪の毛の色は、紫色みのある黒髪が大半を占めますが、水色髪、銀髪の出力が低頻度であります。髪の毛の長さはショートヘアで安定します。
髪の毛の光沢の描画は描画されます。グラデーション表現は控えめです。衣類の光沢表現は描画される場合が低頻度であります。
輪郭線は濃い色で太さもあるため、比較的目立ちます。
Prompt2では、"boy meets girl"も"Android"要素も反映したイメージが出力できています。
v3.1より細かいオブジェクトや細部が描画される傾向にあります。
旧バージョンは
こちら
AingDiffusion XL v1.4
シャツは明るい水色で安定します。パンツはややタイトな短パン形状、レギンス形状の両方があります。長い丈のパンツが出力されることもあります。
髪の毛の色は黒髪、水色髪の出力が多いですが、ピンクヘアーや青髪の出力もあります。
髪の毛の長さはショートヘアが多いですが、飾りがついたり、ポニーテールがつくこともあります。
v1.3と比較すると絵柄や体形の振れ幅が非常に大きくなった印象です。
生成画像の品質がやや低くなったように見えますが、タグの順番等を最適にすると生成画像の品質も上がります。
タグを並び替え、プロンプトを変更した場合には以下の出力になります。
Prompt
Prompt: 1girl, kawaii, plain blue t-shirt, black short pants, standing, upper thigh, masterpiece, best quality
Negative prompt: worst quality, low quality
旧バージョンは
こちら
AnimaVivid v1.0
シャツは明るい水色が多いですが、稀に濃い青色の出力もあります。シャツにはにぎやかなプリントが入る場合が多いです。
パンツはややタイトな短パン形状、レギンス形状の両方があります。
髪の毛はやや長めのショートヘアで安定します。
髪色は、水色髪の割合が多いですが、青髪、青みのある黒髪、紫髪の出力があり、バリエーションの幅が広いです。
Animagine XL v3の発色と背景描画を強化したモデルとされており、精密な背景が出力される傾向にあります。
キャラクターのポージングはAnimagine XLより若干おとなしい印象です。
LizMix ver13
シャツは明るい水色で安定します。無地のシャツが多く、稀にキャラクターのプリントが入ります。
パンツは短パン形状が多く、レギンス形状のものは少なめです。
髪の毛は黒髪がほとんどを占め、水色髪が稀に出力されます。
全体的に淡く若干くすんだカラーの画像が出力される傾向です。
Fiamix XL v4.0
シャツは明るい水色が多いですが、稀に濃い水色の出力もあります。シャツのワンポイントはある場合もありますが、無地のシャツの出力が多いです。
パンツはややタイトな短パン形状がほとんどを占めます。
髪の毛はショートヘアが多いです。髪色は、黒髪が多いですが、金髪の出力もあります。背景は比較的シンプルな出力が多い傾向です。
髪の毛の光沢表現はありますが、グラデーションによる表現は抑えられており、光沢感は弱めです。衣類の光沢表現もありません。
v2.5と比較すると立体感のあるペイントになり、絵柄もリアル感が増した傾向にあります。
Odem v3.0
シャツは明るい水色で安定します。高い確率でシャツにワンポイントが入ります。
パンツはややタイトな短パン形状がほとんどを占めます。
髪の毛はショートヘアになります。髪色は、黒髪と水色髪、金髪が出力されます。背景は比較的シンプルな出力になる場合とにぎやかになるパターンがあります。
髪の毛の光沢表現は控えめです。グラデーションによる表現は抑えられており、光沢感は弱めです。衣類の光沢表現もありません。
輪郭線は濃い色で描画され、比較的目立ちます。
Prompt2では、"boy meets girl"も"Android"要素も反映したイメージが出力できています。
3x3mixXLtypeA v01
シャツは明るい水色がほとんどを占めますが、稀に濃い青色の出力があります。
パンツはややタイトな短パン形状が多いですが、レギンス形状の出力もあります。
髪色は、水色髪の割合が多いですが、青髪、青みのある黒髪、金髪の出力もあり、バリエーションの幅が広いです。
背景は描かれる場合と無地の場合があり、背景が描かれる場合はにぎやかな傾向の背景が出力されます。
Prompt2では、Boy meets girlの要素も、Android の要素も反映された画像が生成できています。
他のモデルより振れ幅が大きくバリエーションが豊かな印象があります。
また、このプロンプトではわかりにくいですが、全身の立ち姿がきれいな印象で風景描写も上手です。
Defacta_XL_3 v3.0
シャツは明るい水色になります。色の変化はほとんどありません。
パンツはややタイトな短パン形状が多いですが、レギンス形状の出力もあります。
髪色は、水色髪または青みのある黒髪のどちらかになります。背景は描画されません。
Prompt2では、Boy meets girl、Android の要素が反映された画像が生成できています。背景が他のモデルと異なる雰囲気の出力になります。
Defacta_XL_3 v3.0 Animagine
Defacta_XL_3 v3.0にAnimagineの要素を加えた出力結果になります。はっきりとした輪郭線が描画されます。
HybridMix_SDXL Mod7_JRUv1_025
シャツは明るい水色になります。シャツの中心にプロントが入る率が高いです。
パンツはややタイトな短パン形状が多いですが、レギンス形状の出力もあります。長い丈のパンツが出力される場合も比較的あります。
髪色は、紫色味みのある黒髪が多く、水色髪の出力が低頻度であります。髪の毛の光沢は控えめで、グラデーション表現は無く、衣類の光沢もありません。
背景はフラット感があり、ポップなカラーリングになり、比較的シンプルな出力になります。
Prompt2では、Boy meets girl、Android の要素が反映された画像が生成できています。
4th tail 系モデル
Prompt2は以下に変更しています。
Prompt2'
Prompt: boy meets girl, cybernetic metal android girl, teenage human boy, city background from above, anime shading, daytime scene, highres, best quality
Negative prompt: worst quality, low quality
Settings: Steps: 20, Sampler: Euler a, CFG scale: 7, Size: 1,536x640
CopyCat v3.1
シャツは明るい水色が多めです。濃い青色のシャツが出力される場合もあります。
パンツはややタイトな短パン形状の出力ですが、長い丈のパンツの出力のほうが多いです。
髪色は、水色髪が多く、青みのある黒髪も同程度で出力されます。稀に金髪の出力もあります。
髪の毛の光沢は控えめで、衣類の光沢も控えめです。グラデーション表現は控えめで、シャープなアニメ的な塗りわけになります。コントラストが強めです。
Prompt2では、Boy meets girl の要素はあまり反映されない結果が多いです。
Prompt 1
Prompt 2
Hyper系モデル
Hyper系のモデルはプロンプトは同じですが生成設定を以下に変更しています。
Prompt1
Settings: Steps: 7, Sampler: Euler a, CFG scale: 2.5
VXP XL v2.2
シャツは明るい水色になります。色の変化はほとんどなく、稀に濃い水色の出力があります。シャツにキャラクターのプリントが入ります。
パンツはややタイトな短パン形状が多いですが、レギンス形状の出力もあります。長い丈のパンツが出力される場合もあります。
髪色は、青みのある黒髪になります。背景は細かく描画される傾向にあります。髪の毛の光沢は控えめで、衣類の光沢もありません。
描写は細かいですが、グラデーション表現は控えめで、シャープなアニメ的な塗りわけになります。なお、Euler a 以外のサンプリングメソッドの場合では画像が荒れる場合があります。
Prompt2では、Boy meets girl、Android の要素が反映された画像が生成できています。背景の精密感が高いです。
Use Your Illusion-HYPER v1.0
シャツは明るい水色になります。色の変化は少なく、稀に濃い水色の出力があります。ほとんどの場合でシャツにキャラクターのプリントが入ります。
パンツはややタイトな短パン形状が多いですが、レギンス形状の出力もあります。
髪色は、黒髪、または青みのある黒髪になります。稀に水色髪の出力があります。背景は細かい模様が描画される傾向にあります。髪の毛の光沢は控えめで、衣類の光沢もありません。
描写は細かいですが、グラデーション表現は控えめで、シャープなアニメ的な塗りわけになります。なお、Euler a 以外のサンプリングメソッドの場合では画像が荒れる場合があります。
Prompt2では、Boy meets girl、Android の要素が反映された画像が生成できています。背景の精密感が高いです。
参考:DreamShaper XL1.0 alpha2
リアル系のモデルですが、アニメ的な絵が出力される場合があります。
参考:SDXL 1.0
学習のベースになっているSDXL1.0でも、イラスト的な出力結果が得られます。絵柄の振れ幅が大きいです。
他モデルでの出力結果の明るめの水色のシャツ、短パン形状はSDXLの影響を受けていると考えられます。
参考:Stable Diffusion 3.5
イラスト系専用モデルではないですが、イラスト的な出力結果が得られます。
Prompt1
Prompt: best quality, kawaii, illustration, 1girl, plain blue t-shirt, black short pants, standing, upper thigh
Negative prompt: worst quality, low quality
Settings: Steps Prior: 30, Sampler: euler, Cfg: 5.5, Scheduler: sgm_uniform, Size: 768x1,024
Prompt2
Prompt: boy meets girl, cybermetrics metal android girl, teenage human boy, city from high position background, anime shading, daytime scene,highres, best quality
Negative prompt: worst quality, low quality
Settings: Steps Prior: 30, Sampler: euler, Cfg: 5.5, Scheduler: sgm_uniform, Size: 1,536x640
シャツはやや濃い明るい水色で出力されます。パンツはややタイトな短パン形状になります。
Stable Diffusion 3.5の場合は、顔が表示されるケースが少なく、下半身が表示される場合が多いです。
髪の毛は茶色または黒髪になります。輪郭線は黒で描画されます。
Prompt2はAndroid要素が反映され、背景もシャープで精密な描写です。レイアウトも良いです。特に、女性のAndroidと、少年の人間のプロンプトが
正しく反映されるケースが多く、ほかのモデルよりプロンプトの理解度と追従性が高いことがわかります。
参考:FLUX.1
イラスト系モデルではないですが、イラスト的な出力結果が得られます。
Prompt1ではプロンプトに忠実な画像が生成できます。Prompt2ではプロンプトを反映できてない部分もありますが、レイアウトや出力画像のクオリティは良いです。
Prompt1
Prompt: Anime standing girl wearing plain blue t-shirt and black short pants upper thigh
Settings: Steps : 20, Scheduler: Simple, Size: 768x1,024
Prompt2
Prompt: anime teenage human boy meets anime cyber metal android girl at city from above position background in daytime scene high-resolution image
Settings: Steps : 20, Scheduler: Simple, Size: 1,536x640
参考:Niji・journey v6 alpha
Prompt2
Prompt: boy meets girl, cybermetrics metal android girl, teenage human boy, city from high position background, anime shading, daytime scene,highres, best quality --ar 12:5
v5より若干リアルなイメージでの出力になります。
参考:Niji・journey v5
Prompt2
Prompt: boy meets girl, cybermetrics metal android girl, teenage human boy, city from high position background, anime shading, daytime scene,highres, best quality --ar 12:5
レイアウトがStable Diffusion系より洗練されています。一方で、プロンプトにはあまり従わない傾向です。
おそらく学習元の画像をかなり厳選して、量より質重視で学習しているのではないかなという印象です。
参考:Midjourney v6(alpha)
Prompt2
Prompt: boy meets girl, cybermetrics metal android girl, teenage human boy, city from high position background, anime shading, daytime scene,highres, best quality, japanese animation style --ar 12:5
著者
iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。