FooocusとAutomatic1111で生成される画像の違い
FooocusとAutomatic1111で生成される画像の違いを確認します。
概要
Fooocusでは簡単に高品質な画像が生成できるよう初期状態で設定がされています。Automatic 1111と生成画像の違いを比較します。
また、プロンプトの理解力がFooocusのほうが高いとの情報もあるため、検証します。
Fooocusでの処理
Fooocusでは手軽に高画質な画像が生成できるよう以下の処理が追加されています。
- プロンプトの自動拡張(GPT2を利用)
- サンプリング処理の拡張
- sd_xl_offset_example-lora_1.0.safetensors の0.1のデフォルト適用
- パラメーターがSDXLモデル用の適切な値に設定されている
- デフォルトのサンプリングメソッドが DPM++ SDE Karras に設定
- プロンプトの強調の正規化
出力画像の比較
デフォルトの設定で起動しモデルを変更しているため、スタイルは以下が適用されている状態です。
- Fooocus V2
- Fooocus Enhance
- Fooocus Sharp
例1
Settings
Prompt: coastal city, from high position, wide view, day, hires, blue sky
Sampling method: DPM++ 2M SDE Karras
Seed: 3622187331149435400
SDXL v1.0 Refinerあり
Fooocusのほうが写真的な仕上がりです。Automatic 1111は明るいイメージでイラスト的な仕上がりです。
Automatic 1111
Fooocus
Conterfeit XL v1.0 Refinerなし
Fooocusのほうが赤みがあり柔らかいイメージが生成されています。Automatic 1111は固めな仕上がりです。
Automatic 1111
Fooocus
BluePencil v1.0.0 Refinerなし
Fooocusのほうが建物がカラフルでリゾート感があります。Automatic 1111は整然とした街並みが表現されます。
Automatic 1111
Fooocus
例2
Settings
Prompt: girl, yellow jacket, black shirt, white long skirt, anime shading, full body, white background
Negative prompt: worst quality, low quality
Sampling method: DPM++ 2M SDE Karras
Seed: 4173623824
Conterfeit XL v1.0 Refinerなし
Automatic1111 はざっくりしたラフ感のある仕上がりです。手書きの水彩画感があります。Fooocusも手書き感がありますが、ラフ感は抑えられています。
一方で、色に関するプロンプトはAutomatic1111 のほうが正確です。Fooocusはスカートの色が黒になっています。
Automatic 1111
Fooocus
BluePencil v1.0.0 Refinerなし
Automatic1111 はかわいい感じの仕上がりです。Fooocusのほうは絵柄が若干大人びています。ペイントにラフ感がなく滑らかさがあります。
Automatic 1111
Fooocus
例3
女の子が持っているのが、花なのかスマートフォンなのか誤解を与えそうなプロンプトでテストします。
Settings
Prompt: girl, girl holding flower, smartphone on the desk, anime shading
Negative prompt: worst quality, low quality
Sampling method: DPM++ 2M SDE Karras
Conterfeit XL v1.0 Refinerなし
Automatic1111 はスマートフォンを握っています。Fooocusは花を握っています。10回以上生成していますが、おおむね同様の傾向です。
BluePencil v1.0.0 Refinerなし
Automatic1111 はスマートフォンを握っています。Fooocusは花を握っています。10回以上生成していますが、おおむね同様の傾向です。
例4
人数(5girls)を指定しています。
Settings
Prompt: 5girls, standing, school girls, white background, anime shading
Negative prompt: worst quality, low quality, 3d
Sampling method: DPM++ 2M SDE Karras
Conterfeit XL v1.0 Refinerなし
Automatic1111 は画面の幅に合わせて結構な人数が描画されています。一方、Fooocusは5人より多い場合もありますが、おおむね5人程度が描画されています。
ただし"white background"のプロンプトは無視され、背景が描画されてしまいます。
評価・所感
生成結果を見ると、Foocusのほうが華のある画像が生成されており、シンプルなプロンプトから品質の高い画像が生成できています。
また、プロンプトの理解力も高く、花とスマートフォンのプロンプトでは、Fooocusでは花を持つ画像が生成できておりこちらも良好です。
一方で、キャラクターの生成結果では、描画結果がきれいになりすぎることや、絵柄が変化する状況、プロンプトが無視される場合もあるため、
ラフ感が欲しい場合やモデルの絵柄がそのままほしい場合にはAutomatic1111のほうが適している場合もありそうです。
著者
iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。