SDXLでよく使われるVAE - Stable Diffusion

SDXLのVAEの紹介です。

VAEとは

変分オートエンコーダ (Variational Auto-Encoder)の略です。
Stable DifussionでのVAEは逆算プロセス処理後の画像出力時のデコードに利用され、VAEの違いが画像の出力の違いに影響します。
補足
Stable Diffusion 1.5のVAEについてはこちらの記事を参照してください。

画像生成のサンプルは以下のプロンプトを利用しています。
Settings
Prompt: grassland, lake, Sailing boat on lake, blue sky, scene, masterpiece
Negative prompt: worst quality, low quality
Sampling method: DPM++ 2M, Sampling steps: 20
Seed:3473297931

SDXL VAE

Stabillity AIが提供しているオリジナルのVAEです。

v1.0

SHA256 Hash: 551eac7037ce58de1ef4447f16d48664c1e67f0e27af50a06b1a6d458b571e0c
画像生成結果です。

v1.0 (fp16)

SHA256 Hash: 235745af8d86bf4a4c1b5b4f529868b37019a10f7c0b2e79ad0abca3a22bc6e1
画像生成結果です。非fp16版とほとんど違いはありません。

Animagine XL 3.1

SHA256 Hash: 63aeecb90ff7bc1c115395962d3e803571385b61938377bc7089b36e81e92e2e
画像生成結果です。SDXLのVAEとほとんど違いがありません。

FlatpieceXL (flatpiecexlVAE_baseonA1579)

Flatpiece Core XL のVAEです。VAEのみでの提供があります。
SHA256 Hash: 74bd3016056b53eeffcadb05a90fd64330addce131f4b218f8e8862131478820~
画像生成結果です。SDXLのVAEより若干明るい画像が生成されます。

LastpieceXL (lastpiecexlVAE_baseonA0897)

Lastpiece Core XL のVAEです。VAEのみでの提供があります。
SHA256 Hash: 538255c0d502c10d327b4733fc7183fdb9b78b5e7592c892f34bbf1059c1fb9e
画像生成結果です。SDXLのVAEより明るい画像が生成されます。

XL_VAE_C

f1

SHA256 Hash: 2125bad8d354d7e951d059e002f1e88ab30165cbc4695ead2c639384ccf4fe6a
画像生成結果です。彩度の高い画像が生成されます。

PPP Animix VAE XL

SHA256 Hash: b08801b8247adaa030b2de8defd02572138ab6bdba39b8a10840022931f5b585
画像生成結果です。SDXLのVAEとほとんど違いがありません。

著者
iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。
掲載日: 2023-07-20
iPentec all rights reserverd.