親指、人差し指、中指の3本指を立てたピースサインの画像を生成する - Stable Diffusion

親指、人差し指、中指の3本指を立てたピースサインの画像を生成するプロンプトの検証と紹介をします。

プロンプトのみで実現する

親指、人差し指、中指の3本指を立てたハンドサインは次のワードで表現できます。
Three-Finger salute
または
three finger salute
salute は "敬礼" の意味です。プロンプトに salute のみを設定した場合は、手を開いて水平にしておでこの位置で敬礼する画像が生成できます。


以下のプロンプトで画像生成をします。
Prompt
1girl, (three finger salute:1.2), white shirt, blue pleated skirt, brown hair, upper body, masterpiece, best quality, very aesthetic, absurdres
Negative prompt:worst quality, low quality, bad hand

Sampling method: DPM++ 2M SDE, Sampling steps: 30

結果は下図です。人差し指と中指のピースサイン、親指と人差し指のピースサインの割合が多く、3本指のサインは低頻度でしか生成されません。 下図では、2つ程度しか生成されていません。
Model:Animagine XL v3.1
Model:Animagine XL v3.1


生成回数を増やして、イメージに近い画像が出力されるまで続ける方法で対応できますが、生成される頻度が低いためやや大変です。

手の形状 + ControlNet AnyTestを利用する方法

手の形状とAnyTestを利用する方法です。
下図の手の形状の線画を準備します。親指、人差し指、中指の3本指を立てたサインの画像です。


準備した画像をControlNetの入力画像に設定します。Preprocessorは"none"に設定し、Modelを"CN-anytest_v4-marged [4bb64990]"を選択します。 AnyTestモデルについてはこちらの記事を参照してください。
Weightは1、Starting Control Stepは0、Ending Control Stepは1 とします。


ControlNetを有効にして、以下のプロンプトで画像を生成します。
Prompt
1girl, (three finger salute:1.2), white shirt, blue pleated skirt, brown hair, upper body, masterpiece, best quality, very aesthetic, absurdres
Negative prompt:worst quality, low quality, bad hand

Sampling method: DPM++ 2M SDE, Sampling steps: 30

結果は下図です。手の形状は固定されるため、崩れる場合もありますが、3本指を立てたサインの画像が生成されます。 ただし、手と体が整合性をもってつながらない画像が生成されてしまう場合もあり、崩れてしまう画像も生成されますが、プロンプトのみの結果より成功確率は上がります。
Model:Animagine XL v3.1
Model:Animagine XL v3.1

アウトラインの線画 + ControlNet Canny を利用する方法

キャラクター全体の外形のアウトラインの線画を利用して画像を生成する方法です。
下図の画像を作成します。キャラクターのアウトラインの画像です。手の部分は。親指、人差し指、中指の3本指を立てたサインの形状を作画します。


準備した画像をControlNetの入力画像に設定します。Preprocessorは"lineart_realistic"に設定し、Modelを"ontrol-lora-canny-rank256.safetensors [ec2dbbe4]"を選択します。 モデルについてはこちらの記事を参照してください。
Weightは1、Starting Control Stepは0、Ending Control Stepは1 とします。


ControlNetを有効にして、以下のプロンプトで画像を生成します。
Prompt
1girl, (three finger salute:1.2), white shirt, blue pleated skirt, brown hair, upper body, masterpiece, best quality, very aesthetic, absurdres
Negative prompt:worst quality, low quality, bad hand

Sampling method: DPM++ 2M SDE, Sampling steps: 30
結果は下図です。手の形状と体のアウトラインは固定されるため、意図した形状での画像が生成できます。 一方で、生成画像のバリエーションや変化は少ないです。ContorlNetの入力画像の線画には目や口を描画していないため、表情や目の形状の違いはあります。
Model:Animagine XL v3.1
Model:Animagine XL v3.1

親指、人差し指、中指の3本指を立てたサインの画像を生成できました。
著者
iPentecのメインデザイナー
Webページ、Webクリエイティブのデザインを担当。PhotoshopやIllustratorの作業もする。
掲載日: 2023-08-01
iPentec all rights reserverd.