Hires. fix のアップスケーラーの比較 (Latent, 4x-AnimeSharp, 4x-UltraSharp, R-ESRGAN 4x+ Anime6B, SwinIR_4x) - Stable Diffusion

Hires. fix のアップスケーラーの比較をします。

概要

こちらの記事では4x-UltraSharpアップスケーラーをインストールしました。 また、こちらの記事では、4x-AnimeSharpアップスケーラーをインストールしました。 この記事では、他のアップスケーラーと比較し、出力される画像がどのように変化するかを確認します。

比較1

以下のプロンプトで画像を出力します。今回はステップの途中で構図が大きく変化しないよう、Sampling methodにDDIMを指定しています。
a girl, (from front), extreme pretty girl,full body, standing,  yellow jacket,white one piece dress, long skirt, white background, black boots,, official art
Negative prompt: worst quality,
Steps: 20, Sampler: DDIM, CFG scale: 7, Seed: 389413406, Size: 512x768, Model hash: db6cd0a62d, Model: Counterfeit-V3.0, Denoising strength: 0.7

Hires. fix なし

アップスケーラーがない場合の出力結果です。こちらがベースになります。


横向きに近い状態のポーズです。


Hires. fix : Latent

Latentでアップスケールした出力結果です。


ポーズが変わってしまっています。足先の向きは変わっていませんが、腰をひねるような体勢でお尻と背中を向けているポーズになっています。 背景の書き込みも激しくなっています。

Hires. fix : 4x-AnimeSharp

4x-AnimeSharpでアップスケールした出力結果です。


ポーズはオリジナルから変わってしまい、腰をひねるような体勢でお尻と背中を画面側に向けているポーズになっています。 背景はオリジナルに近い状態です。

Hires. fix : 4x-UltraSharp

4x-UltraSharpでアップスケールした出力結果です。


ポーズや形状は、オリジナルから変わってしまいますが、4x-AnimeSharpとほぼ同じポーズや形状です。 違いで大きな部分は顔の絵柄が、4x-AnimeSharpよりやや大人びた出力になっています。

Hires. fix : R-ESRGAN 4x+ Anime6B

R-ESRGAN 4x+ Anime6Bでアップスケールした出力結果です。


オリジナルと同じ右向きになっており、ポーズも比較的、オリジナルと似た体勢です。
髪の毛や体に小さなパーツがいくつか追加されています。

Hires. fix : SwinIR_4x

SwinIR_4xでアップスケールした出力結果です。


Latent, 4x-AnimeSharp,4x-UltraSharp と似たポーズになりました。

比較2

以下のプロンプトで画像を出力します。今回はステップの途中で構図が大きく変化しないよう、Sampling methodにDDIMを指定しています。
1girl, beautiful girl, 28 years old, ((from front)), white dress,shoulder straps, middle skirt, blue white hair, blue ribbon on head, white white background, standing
Negative prompt: worst quality, from side, bad bad anatomy,
Steps: 20, Sampler: DDIM, CFG scale: 7, Seed: 871637327, Size: 512x768, Model hash: db6cd0a62d, Model: Counterfeit-V3.0, Denoising strength: 0.7

Hires. fix なし

アップスケーラーがない場合の出力結果です。こちらがベースになります。


背景に顔がある (顔が3つある)点に注目です。

Hires. fix : Latent

Latentでアップスケールした出力結果です。


背景の顔が髪の毛に変わってしまいました。帽子をかぶっている、ドレスの肩ストラップの色が白くなるなど、小物にも変化が出ています。

Hires. fix : 4x-AnimeSharp

4x-AnimeSharpでアップスケールした出力結果です。


背景の顔が髪の毛に変わってしまいました。ドレスの形状はオリジナルに近い状態です。

Hires. fix : 4x-UltraSharp

4x-UltraSharpでアップスケールした出力結果です。


4x-AnimeSharpと似た出力結果です。ドレスの上半身の形状が若干違います。

Hires. fix : R-ESRGAN 4x+ Anime6B

R-ESRGAN 4x+ Anime6Bでアップスケールした出力結果です。


ドレスの肩ストラップの色が青くなっており、形状の変化はあります。背景の顔は無くなります。。

Hires. fix : SwinIR_4x

SwinIR_4xでアップスケールした出力結果です。


ドレスの肩ストラップの色が青くなっており、形状の変化はあります。こちらも背景の顔は無くなってしまいます。

比較

なし(オリジナル)Latent4x-AnimeSharp4x-UltraSharpR-ESRGAN 4x+ Anime6BSwinIR_4x












まとめ

アップスケールにより、若干の違いはありますが、アップスケール処理により細かい描画が追加できています。
一方でアップスケールなし版と比較すると、構図の変化やパーツや小物の変化が発生しており、元の画像のイメージを維持したまま アップスケールできないことがわかります。
アップスケーラーの違いによる画質の違いは、それほど大きな違いはない印象です。 むしろオリジナルの構図が維持されない点のほうが、課題かと思われます。

また、個人的な感覚ですが、アップスケールすると、描き込みが増え、細かい部分まで描画されるため、 絵の見ごたえはありますが、絵としてのバランスが若干崩れる印象を感じます。 絵としてのまとまりは、オリジナルのアップスケーラーなしのものが一番良いように感じられます。
著者
iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。
掲載日: 2023-05-29
iPentec all rights reserverd.