こちらの記事では、Stable Diffusion XL 1.0(SDXL 1.0)の導入方法と使い方について解説しています。
Stability AIは2023年7月27日に、最新の画像生成AIモデル Stable Diffusion XL 1.0をオープンソースとして公開しました。
研究目的で先行リリースされていたSDXL 0.9の正式版として出たのがSDXL 1.0です。
最新の高性能版ということで、リリースを楽しみにしていた人も多いのではないでしょうか。
まず最初に、SDXL 1.0の特徴や従来モデルとの違い、デメリットに触れてから、インストール方法と使い方について説明します。
SDXL 1.0とは? 特徴や従来との違い
SDXL 1.0とは、Stability AIが公開したStable Diffusionの最新モデルです。
画質が良くなったり、サイズアップ、2ステップの画像生成方式など、SDXL 1.0は大幅にバージョンアップされたモデルになりました。
ただし、SDXL 1.0にもデメリットがあります。
画質の向上とサイズアップ
モデルのパラメーター数が9億から23億に増えたことで、描写力が大幅に向上しました。
また、Stable Diffusionの従来モデルは512×512ピクセルの画像で学習されていましたが、SDXL 1.0では1024×1024ピクセルと画像サイズが大きくなっています。
指や文字の描写も向上したという話ですが、まだまだ難しいようです。従来よりも成功率が少し高いかもしれません。
従来モデルでは「masterpiece」「best quality」「photo realistic」など画質や品質に関するプロンプトを入れていましたが、SDXL 1.0はこうしたプロンプトを入れる必要がなくなりました。
1pass式から2pass式へ変更
SDXL 1.0では、1回の画像生成で2回生成するプロセスになりました。
これがSDXL 1.0の画質を引き上げる仕組みですね。
具体的には、ベース(Base)→リファイナー(Refiner)の2回で処理します。
この2ステップの処理により、SDXL 1.0では高画質な画像生成を実現しています。
SDXL 1.0のデメリット
画質が向上したSDXL 1.0ですが、デメリットもあります。
SDXL 1.0は従来のStable Diffusionと互換性がありません。
従来のStable DiffusionをベースにしたLORAなどが使えないということです。
今後、SDXL 1.0に対応したLORAがリリースされるのを期待するしかなさそうです。
SDXL 1.0では、ControlNetなどの拡張機能が対応していないのもデメリットです。
これも将来的には対応可能になるかもしれません。
また、SDXL 1.0ではモデルサイズが大きくなったので、VRAMの消費が大きくなりました。
SDXL 1.0ではVRAMを9GBくらい使用するので、VRAM12GBのグラボの使用が推奨されます。
今後もStable Diffusionの性能は向上していくと思うので、よりハイスペックのグラボが必須になるでしょうね。
以上、フラグシップモデルのStable Diffusion XL 1.0の導入方法と使い方について説明しました。早速、SDXL 1.0をインストールして使ってみてくださいね。