【StableDiffusion】オススメ拡張機能や便利ツール

結局のところ必要なものさえ集めてしまえば、いつでも誰でもそれなりのAIイラストが生成できるようになる。

Automatic1111を更新した際に、必要なモデルや拡張機能を整理したので、ついでにここにまとめておく。

説明はかなり不親切だから注意。

これがあると便利
- 拡張機能
- Quicksettings listの編集
イラストの質向上
- 拡張機能
- EmbeddingsやLoRAなど
イラストの修正・補正
- 拡張機能
- 便利ツール（WebUIの拡張機能ではない）
プロンプト生成の補助
- 拡張機能
- ChatGPTの活用

これがあると便利

作業効率アップ系。

拡張機能

Config-Presets

GitHub - Zyin055/Config-Presets: Extension for Automatic1111

いろいろな設定をプリセットとして保存・復元できるようにする拡張機能。

起動のたびにワンクリックで設定を呼び出せるため、いちいち手動で数値をいじる手間が省ける。

Styles-Editor

GitHub - chrisgoringe/Styles-Editor: Simple editor for styles in Automatic1111

Stylesに保存したプロンプトをWebUI上で簡単に削除・編集できるようにする拡張機能。

Stylesとは、ポジティブプロンプトとネガティブプロンプトを、テンプレートとして保存しておけるデフォルトの機能。

これがあれば、Styles.csvをいちいちメモ帳に開いて編集しなくてよくなる。

sd-webui-ar

GitHub - alemelis/sd-webui-ar: Select img aspect ratio from presets in sd-webui

Aspect Ratio selector

画像のアスペクト比をプリセットから選択できるようにする拡張機能。

「1:1」「3:2」「16:9」など、アスペクト比をワンクリックで変更できるようになる。

他にも、アスペクト比を保存したり、アスペクト比の計算機を使って、画像サイズを計算できるぞ。

stable-diffusion-webui-images-browser

GitHub - AlUlkesh/stable-diffusion-webui-images-browser: an images browse for stable-diffusion-webui

WebUI上で、生成されたイラストの確認・検索・削除が簡単にできるようになる拡張機能。

outputフォルダ内に保存された画像を、画像の名前やプロンプトや日付などで検索することができたり、とにかく便利。

canvas-zoom

GitHub - richrobber2/canvas-zoom: zoom and pan functionality

InpaintやSketchなどのタブで画像を拡大・縮小・移動できるようになる拡張機能。

画像の細部を確認したり、修正したりするときに便利で、さらにショートカットキーでいろいろ操作できるようになる。

sd-webui-enable-checker

GitHub - shirayu/sd-webui-enable-checker: Checker of "enable" statuses in SD Web UI

WebUI上で、現在有効化している拡張機能のタブに色がついて、一目で分かるようになる拡張機能。

Quicksettings listの編集

WebUIの画面上部のメニューからVAEの切り替えとかをできるようにする設定。

SettingsのUser interfaceからQuicksettings listを編集しよう。

イラストの質向上

イラスト生成の幅を広げたり、イラストの質を向上させてくれるもの。

拡張機能

a1111-sd-webui-lycoris

GitHub - KohakuBlueleaf/a1111-sd-webui-lycoris: An extension for stable-diffusion-webui to load lycoris models.

単純にLyCORISを使用できるようにする拡張機能。LyCORISはLoRAの亜種。

adetailer

GitHub - Bing-su/adetailer: Auto detecting, masking and inpainting with detection model.

AIが苦手とする小さい領域への描写を補正してくれる神拡張機能。

生成されるイラストの顔や手を自動認識して崩れを補正してくれる。

また、ADetailerが検出したエリアにだけプロンプトを反映するという機能があり、これで表情の差分を作ったりするのが楽にできるぞ。

生成に時間がかかるようになるが、常時有効で良いくらいなのでuiconfigをいじってデフォルト有効にしている。

また、設定からSave mask previewsをオンにしておくと、outputでどこを自動認識して補正してくれたのかわかるのでよい。

sd-webui-cutoff

GitHub - hnmr293/sd-webui-cutoff: Cutoff - Cutting Off Prompt Effect

プロンプト内の色の指定を他の要素に移らないようにする拡張機能。

Target tokensにカンマ区切りで他の要素と分離して効かせたい色を入力する必要があって面倒なので、これもuiconfigをいじってデフォルトで値を入れて、さらにデフォルト有効にしている。

multidiffusion-upscaler-for-automatic1111

GitHub - pkuliyi2015/multidiffusion-upscaler-for-automatic1111: Tiled Diffusion and VAE optimize, licensed under CC BY-NC-SA 4.0

生成されたイラストを高画質化するための拡張機能。

VRAMの制限に関係なく、大きな画像サイズにアップスケールできる。

Tiled Noise Inversionという機能で、画像の細部を補正できる。

t2iやi2iで画像を生成するときに、Tiled DiffusionやTiled VAEのタブから各種設定できるぞ。

sd-dynamic-thresholding

GitHub - mcmonkeyprojects/sd-dynamic-thresholding: Dynamic Thresholding (CFG Scale Fix) for SD Auto WebUI

CFG Scaleの値を高く設定したときに、画像の色が変になったり破綻したりするのを防ぐことができる拡張機能。

EmbeddingsやLoRAなど

EasyNegative

gsdf/Counterfeit-V3.0 · Hugging Face

言わずと知れたNegative Embeddings

みんな使ってる。

ネガティブプロンプト用に開発された特殊なモデルで、この単語をネガティブプロンプト内に記入するだけで、多くのネガティブプロンプトを入力したときと同じような効果が得られるようになる。

EasyNegativeとEasyNegativeV2があるのだが、それぞれの特徴を知っておいた方がよい。

Deep Negative

Deep Negative V1.x - V1 75T | Stable Diffusion Textual Inversion | Civitai

同じく自分がよく使っているNegative Embeddings

flat2、add_detail

画像の陰影、描き込み量を制御できるLoRA

これも非常に多くの人が使っている。

flat2とは逆のadd_detailというLoRAもあり、±を逆にすることでどちらも同じように使える。

epi_noiseoffset

epi_noiseoffset - v2 | Stable Diffusion LoRA | Civitai

画像のコントラストを制御するLoRA

flat2やadd_detailなどと併用することでいい感じになってる気がしている。

EnvyBetterHands

AIが苦手とする手の形を補正してくれるLyCORIS

なんやかんやして手の形を補正してくれるものの中ではかなり優秀。

説明に書いてあるがプロンプトにnice hands, perfect handsなどを入れるとよい。

その他オススメLoRA集

マジでありがたいLoRAまとめ↓
あなたの性癖の為のLoraリンク集｜にきもなか

イラストの修正・補正

イラストの修正や補正を行う便利機能やツール。

拡張機能

sd-webui-controlnet

GitHub - Mikubill/sd-webui-controlnet: WebUI extension for ControlNet

言わずと知れた ControlNet

生成されるイラストのポーズを参考画像や棒人間などで指定できるようにする神拡張機能。

様々な機能があるから使い方を勉強しよう。

sd-webui-depth-lib

GitHub - jexom/sd-webui-depth-lib: Depth map library for use with the Control Net extension for Automatic1111/stable-diffusion-webui

ControlNetのDepthを使って、手の修正を補助してくれる拡張機能。

これは使い方とか含めてわかりやすい解説動画を観た方がよい。

sd-webui-inpaint-anything

GitHub - Uminosachi/sd-webui-inpaint-anything: Inpaint Anything extension performs stable diffusion inpainting on a browser UI using masks from Segment Anything.

生成されたイラストの一部を消したり修正したりできるようにする拡張機能。

まぁこれも解説動画を探して観るのがよい。

便利ツール（WebUIの拡張機能ではない）

Lama Cleaner

GitHub - Sanster/lama-cleaner: Image inpainting tool powered by SOTA AI Model. Remove any unwanted object, defect, people from your pictures or erase and replace(powered by stable diffusion) any thing on your pictures.

画像の中の不要な部分を消したり、欠けた部分を埋めたりすることができるとんでもない便利ツール。

しかも無料でダウンロードできて、Photoshopなどの高価なソフトウェアを持っていなくても、画像の修正が簡単にできてしまう。

Transparent-Background

GitHub - plemeri/transparent-background: This is a background removing tool powered by InSPyReNet (ACCV 2022)

コマンドライン操作の背景切り抜きツール。

無料で高機能な背景切り抜きができてしまう。

インストール方法や使い方は解説動画を観るとよい。

PoseMY.Art

PoseMy.Art | Free tool to create reference poses with 3D models.

3Dモデルを使ってポーズを作成できる無料のオンラインツール。

会員登録も不要で、人形をいじくりまわしてControlNet用の画像を作成することができるぞ。

プロンプト生成の補助

プロンプト力を高める。

拡張機能

a1111-sd-webui-tagcomplete

GitHub - DominikDoom/a1111-sd-webui-tagcomplete: Booru style tag autocompletion for AUTOMATIC1111's Stable Diffusion web UI

プロンプトの入力を自動補完してくれる拡張機能。

プロンプトにタグを入力するときに、候補を表示してくれる。

候補は、Danbooruやe621などのイラストサイトから取得したもので、これらのタグが使われているモデルが多く大体機能する。

設定画面から表示数や言語などを変更するとよい。

stable-diffusion-webui-daam

GitHub - toriato/stable-diffusion-webui-daam: DAAM for Stable Diffusion Web UI

生成されたイラストのどこにプロンプトが効いているのかをヒートマップで可視化できるようにする拡張機能。

上手く動かないことがあるし正直あまり使ってはいないが、プロンプトから余計な単語を排除してより洗練したいときには役立つと思う。

stable-diffusion-webui-wd14-tagger

GitHub - toriato/stable-diffusion-webui-wd14-tagger: Labeling extension for Automatic1111's Web UI

画像からプロンプトを抽出することができる拡張機能。

画像をドラッグアンドドロップするだけで、画像に含まれる要素をタグとして出力できる。

そしてボタンひとつでプロンプトをt2iやi2iに送ることができる

stable-diffusion-webui-two-shot

GitHub - ashen-sensored/stable-diffusion-webui-two-shot: Latent Couple extension (two shot diffusion port)

生成されるイラストのキャラクターをプロンプトに含まれる複数のフレーズに対応させることができる拡張機能。

画面を分割してキャラクターを描き分けることができる。

ひとつのイラスト内に複数のキャラクターがいて、それぞれにプロンプトに指定して反映させたいという場合に必須。

sd-webui-neutral-prompt

GitHub - ljleb/sd-webui-neutral-prompt: Collision-free AND keywords for a1111 webui!

矛盾したプロンプトを上手く調和して画像を生成できるようになる拡張機能。

AND_PERPというキーワードを使って、矛盾したプロンプトを指定できるようになる。

sd-webui-prompt-all-in-one

GitHub - Physton/sd-webui-prompt-all-in-one: This is an extension based on sd-webui, aimed at improving the user experience of the prompt/negative prompt input box. It has a more intuitive and powerful input interface function, and provides automatic translation, history record, and bookmarking functions.

プロンプトの入力を補助する様々な機能を提供する拡張機能。

日本語のヘルプがついていて使い方は見ればすぐにわかると思う。

超便利なのでとりあえず入れておけ。

ChatGPTの活用

ChatGPTやBingChatなどに、プロンプトの生成を補助してもらうのがよい。