この記事では、Stable Diffusionのプロンプトや呪文のコツや基本を紹介してます。
ツイッターやブログで見かけるような美女や美少女を作りたいけど、イマイチ上手くいかないというStable Diffusion初心者のためのプロンプトのコツになります。
何事にもコツはあるということで、Stable Diffusionのプロンプトのコツをみていきましょう。
プロンプト・呪文のコツ
プロンプトの基本は英語です。
プロンプトは日本語でも可能とされていますが、Stable Diffusionに理解されないことも多いので、英語でプロンプトを入力することを推奨します。
プロンプトごとにカンマで区切ります。
ちなみに、実写かアニメ画かを切り替えるのは、プロンプトではなくモデルによるものです。
① 前に入力したプロンプトは優先順位が高くなる
プロンプトは先頭に入力したものが優先順位が一番高くなり、それ以降はだんだん優先順位が落ちていきます。
プロンプトの順番を入れ替えるだけで、生成される画像が微妙に変わることがあります。
一番後ろに入力したプロンプトでも、反映されやすいこともあるので、この優先順位は目安程度にしたほうがいいです。
この優先順位はプロンプトやモデルに依存する要素です。
② 多くのプロンプトを詰め込まないほうがいい
Stable Diffusionでは、75単語のプロンプトを入力することができます。
この単語のことをトークンと呼びます。
多くのトークンを詰込みすぎると、画像に反映されないプロンプトが多くなります。
ですので、必要最低限のプロンプトに絞ったほうがいいです。
無視されるプロンプトがあるので、最初からプロンプトを書き込まず、試しに画像生成してみてから、足りないプロンプトを追加したり、削除するのがコツと言えます。
③ カッコによる強調でプロンプトに強弱をつける
カッコを付けるとプロンプトを強調することができます。
プロンプトの効きが甘い場合にカッコで強調します。
コロンの後に小数点の数字を入力して、強さを表現することもできます。
例(prompt:1.3)
強調の数値は最大でも1.5くらいが目安、あまり大きくしないほうがいいです。
逆に数値を1よりも小さくすることで、プロンプトを弱めることも可能です。
例(prompt:0.8)
④ モデルやLORAにより推奨されているプロンプトがある
モデルやLORA、LyCORISによっては、入れたほうがいいプロンプトや入力必須のプロンプトがあります。
HuggingFaceやCivitAiなどでは、モデルやLORAごとに推奨プロンプトが書かれていることがあるので、参考にしましょう。
LORAで入力必須のプロンプトは、Trigger Words(トリガーワード)と呼ばれます。
Trigger Wordsを入れないとLORAやLyCORISが発動しません。
プロンプト・呪文は重要ではない?
正直、プロンプトはあまり重要ではありません。
もちろん、必要なものはプロンプトに入れて画像に反映されなければいけませんが、プロンプト自体は良い画像になるかどうかを決める要素ではないからです。
プロンプトは男か女か、人数、ポーズやアングル、髪型や服装、背景やインテリアなどのディテールを指定するものです。
だいたい、こんな感じの画像が欲しいなというものをプロンプトとして入力します。
必要不可欠なプロンプトが入力されていれば、あとは適当とか、だいたいでいいのです。
顔が崩れたり、ボヤけたりして、美女や美少女を出せないのは、Hires.fixを使っていないからだと思います。
最近では、Hires.fixの他にControl NetのTileという拡張機能も使われます。
まさに日進月歩で、Stable Diffusionの新しい拡張機能が追加されていきますね。
あとはシード値によっても顔や背景などが変わるので、シード値を変えながら連続生成して、自分好みのイラストを探す方法がいいと思います。
美女や美少女、画像のクオリティの良し悪し等の感じ方は人によって違いますからね。
シード値やサンプラーが異なれば、生成される画像も変わってくるので、各種パラメーターの設定のほうがプロンプトよりも重要です。
一発で自分の欲しい画像を出すのは無理だと思います。試行錯誤を繰り返して、自分の思ったとおりの画像を生成するしかないです。
シード値を見て、どんな画像が出力されるか、事前に分かる人はいないですからね。
ネガティブプロンプトのコツに関しては別の記事で書こうと思います。
以上、Stable Diffusion初心者向けのプロンプトのコツと基本について書いてみました。実写やアニメのプロンプトのコツを活用してみてくださいね。