生成画像の解像度を上げて、画像の細部を描画する - Hires.fix の利用 - Stable Diffusion
Hires.fix を利用して、生成画像の解像度を上げて、画像の細部を描画する手順を紹介します。
概要
Stable Diffusionで以下のプロンプトで、画像を生成しました。
Prompt
Prompt: 1girl, standing, full body, dark blue t-shirt, BREAK blue jacket, (unzipped jacket:1.2), BREAK white long skirt, light blue hair, Illustration, black boots, white background, simple background, masterpiece, best quality
Negative prompt: worst quality, low quality
下図の画像が生成できました。原寸で表示すると若干、顔の描画が荒いため、より精細な画像を生成したいです。
Hires.fixを利用すると、解像度を上げた画像を生成でき、より精密な画像が生成できます。
手順
[Reuse seed from last generation]ボタン(下図オレンジ〇で囲まれたボタン)をクリックします。
直前に生成した画像のSeed値がSeedのテキストボックスに設定され、同じ画像が生成される状態になります。
[Generation]タブの[Hires.fix]のチェックボックスをクリックしてチェックをつけます。
Hires.fixのパネルをクリックすると、パネルが開き、設定項目が表示されます。
デフォルトの設定は下図です。設定を変更せず、[Generate]ボタンをクリックし、画像を生成します。
画像が生成されます。通常の生成より処理時間がかかります。
生成された画像は下図です。ジャケットのワンポイントや袖などが元の画像から変わってしまっていますが、全体が精密に描画されます。
Upscale by を変更する
[Upscale by]の値を変更することで元の画像よりさらに大きい画像を生成できます。
[Upscale by]の値を"3"にします。
生成結果は下図です。
顔の描画は細かくなりましたが、足や衣類に崩れが目立ちます。
なお、[Upscale by]の値を"1"にした場合は以下の結果となります。
"1"の場合は精細感は高まらない結果となりました。輪郭線がしっかり描画される結果になりました。
比較
元画像
Hires.fix x2
Hires.fix x3
Hires.fix x1
顔部分です。
元画像
Hires.fix x2
Hires.fix x3
Hires.fix x1
以前のUIでの手順
以前のUIでStable Difffusion 1.5を利用した場合の手順です。
Hires. fixを利用してアップスケーリングする手順を紹介します。
画像生成画面(txt2img,img2img)の[Generation]タブ内の[Hires. fix]のタイルをクリックします。
タイルが開きます。タイルが開いた状態になると、Hires. fixが有効になります。
設定はデフォルトのままとします。以下の設定とします。
Upscaler Latent
Hires steps 0
Denoising strength 0.7
Upscale by 2
[Generate]ボタンをクリックして画像生成を実行します。
Hires. fixを有効にしていない場合の画像生成結果です。
アップスケーリングの処理は通常の処理に比べて2倍以上の時間がかかります。
Upscale by の値に2を指定しているため、元のサイズの512x768の2倍のサイズである1,024x1,576のサイズで出力されます。
アップスケーリングは単純な拡大ではないため、キャラクターの衣類のデザインがアップスケーリングなしの結果と異なっていることが確認できます。
ただし、全体の画像のバランスや雰囲気は維持された状態です。
Hires. fix なし Hires. fix あり
顔のピクセル数も2倍になるため、表情もつぶれていないことが確認できます。
Hires. fix なし Hires. fix あり
masterpiece, 1 pretty girl, staiding, full body, blue jacket, white long skirt, Illustration,Character setting table, white background
Negative prompt: EasyNegativeV2
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 1328764141, Size: 512x768, Model hash: db6cd0a62d, Model: Counterfeit-V3.0, Denoising strength: 0.7, Hires upscale: 2, Hires upscaler: Latent
補足
アップスケーラーの違いによる出力画像の違いは
こちらの記事 を参照してください。
著者
iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。
最終更新日: 2024-08-22
作成日: 2023-05-19