アップスケーラーの違いによるアップスケール画像の比較 - Stable Diffusion

アップスケーラーの違いで、アップスケール画像にどのような違いがあるかを比較します。

比較手順

あらかじめ準備した画像をアップスケールして結果を比較します。
画像は下図の画像を利用します。


参考:プロンプト
画像は以下のプロンプトで生成しています。
Prompt:1girl, (from front), full body, standing, yellow jacket,white one piece dress, long skirt, black boots, official art,at balcony, old european fantasy city view,  masterpiece, best quality, hires, very aesthetic
Negative prompt:worst quality, low quality, very displeasing
Model:animagine-xl-3.1
Steps: 30, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 3688246095, Size: 768x1024

Stable Diffusion WebUI を起動します。[Extras]タブをクリックして選択します。下図の画面に切り替わります。


[ここに画像をドロップ -または- クリックしてアップロード]の枠に先に準備した画像をドロップするか、枠をクリックして表示されるファイル選択ダイアログで画像を選択します。 画像が設定され、サムネイルが枠に表示されます。


[Upscaler 1]のドロップダウンリストをクリックします。ドロップダウンリストが表示されますので、アップスケーラーを選択します。
[Scaled by]の枠の[Resize]の値は"4"とします。


[Generate]ボタンをクリックします。アップスケールされた画像が右側に表示されます。

アップスケーラーの比較

Nearest

単純に拡大した処理に近い結果となります。ピクセル感があります。



Lanczos

Nearestより滑らかな画像です。他のアルゴリズムより、輪郭が滲んでいる結果です。べた塗り部分で若干ノイズが出ています。



ESRGAN 4x

Lanczos よりシャープ感のある結果です。べた塗り部分で若干ノイズが出ています。



R-ESRGAN 4x+

ESRGAN 4x よりさらに鮮明な結果になります。



R-ESRGAN 4x+ Anime6B

R-ESRGAN 4x+と鮮明感は同程度ですが、彩度が若干上がり、色が濃く出力される結果となります。また、べた塗り部分のノイズがほとんどありません。



Scunet

境界の鮮明感は ESRGAN 4x のような鮮明さはありませんが、色のフラット感があり、ノイズが少ない結果です。



scunet-psnr

Scunetと比較すると、彩度が若干上がり、色が濃く出力される結果となります。



SwinIR 4x

鮮明感のある結果です。R-ESRGAN 4x+ / R-ESRGAN 4x+ Anime6B との比較では、細部の境界がよりはっきりアップスケールされる印象です。



4x AnimeSharp

SwinIR 4x と似た結果になりますが、SwinIR 4xより、若干暗い色で出力され、色が濃くなる印象です。細部の描画はSwinIR 4x と似ています。



4x UltraSharp

4x AnimeSharp よりより細部までアップスケールされる結果になります。色も4x AnimeSharp より、若干暗い色で出力され、色が濃くなる印象です。 また、若干ノイズが出てしまう場所もあります。



4x FatalAnime

4x AnimeSharpほどではありませんが、細部までアップスケールされる結果になります。一方でノイズ感は、4x UltraSharp より抑えられています。



まとめ

アップスケーラーの違いによる結果を比較しました。
ESRGAN 4x, R-ESRGAN 4x+, R-ESRGAN 4x+ Anime6B では輪郭線やエッジの鮮明感が上がった結果になります。一方で、フラット感が強まり、単調な画像になってしまう傾向もあります。 一方、Scunetは輪郭線の鮮明さは落ちますが、ノイズが少なく、アップスケール結果は柔らかい画像になる印象です。
SwinIR 4x, 4x AnimeSharp, 4x UltraSharp, 4x FatalAnimeの結果は鮮明感が上がりますが、ESRGAN よりより細部までアップスケーリングされ、ESRGAN であったフラット感が強まらない、 印象があります。
補足
4x-AnimeSharp アップスケーラーや他のアップスケーラーとの出力画像の比較についてはこちらの記事も参照してください。





著者
iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。
掲載日: 2023-05-29
iPentec all rights reserverd.