結局のところ必要なものさえ集めてしまえば、いつでも誰でもそれなりのAIイラストが生成できるようになる。
Automatic1111を更新した際に、必要なモデルや拡張機能を整理したので、ついでにここにまとめておく。
説明はかなり不親切だから注意。
これがあると便利
作業効率アップ系。
拡張機能
Config-Presets
GitHub - Zyin055/Config-Presets: Extension for Automatic1111
いろいろな設定をプリセットとして保存・復元できるようにする拡張機能。
起動のたびにワンクリックで設定を呼び出せるため、いちいち手動で数値をいじる手間が省ける。
Styles-Editor
GitHub - chrisgoringe/Styles-Editor: Simple editor for styles in Automatic1111
Stylesに保存したプロンプトをWebUI上で簡単に削除・編集できるようにする拡張機能。
Stylesとは、ポジティブプロンプトとネガティブプロンプトを、テンプレートとして保存しておけるデフォルトの機能。
これがあれば、Styles.csvをいちいちメモ帳に開いて編集しなくてよくなる。
sd-webui-ar
GitHub - alemelis/sd-webui-ar: Select img aspect ratio from presets in sd-webui
Aspect Ratio selector
画像のアスペクト比をプリセットから選択できるようにする拡張機能。
「1:1」「3:2」「16:9」など、アスペクト比をワンクリックで変更できるようになる。
他にも、アスペクト比を保存したり、アスペクト比の計算機を使って、画像サイズを計算できるぞ。
stable-diffusion-webui-images-browser
GitHub - AlUlkesh/stable-diffusion-webui-images-browser: an images browse for stable-diffusion-webui
WebUI上で、生成されたイラストの確認・検索・削除が簡単にできるようになる拡張機能。
outputフォルダ内に保存された画像を、画像の名前やプロンプトや日付などで検索することができたり、とにかく便利。
canvas-zoom
GitHub - richrobber2/canvas-zoom: zoom and pan functionality
InpaintやSketchなどのタブで画像を拡大・縮小・移動できるようになる拡張機能。
画像の細部を確認したり、修正したりするときに便利で、さらにショートカットキーでいろいろ操作できるようになる。
sd-webui-enable-checker
GitHub - shirayu/sd-webui-enable-checker: Checker of "enable" statuses in SD Web UI
WebUI上で、現在有効化している拡張機能のタブに色がついて、一目で分かるようになる拡張機能。
Quicksettings listの編集
WebUIの画面上部のメニューからVAEの切り替えとかをできるようにする設定。
SettingsのUser interfaceからQuicksettings listを編集しよう。
イラストの質向上
イラスト生成の幅を広げたり、イラストの質を向上させてくれるもの。
拡張機能
a1111-sd-webui-lycoris
単純にLyCORISを使用できるようにする拡張機能。LyCORISはLoRAの亜種。
adetailer
GitHub - Bing-su/adetailer: Auto detecting, masking and inpainting with detection model.
AIが苦手とする小さい領域への描写を補正してくれる神拡張機能。
生成されるイラストの顔や手を自動認識して崩れを補正してくれる。
また、ADetailerが検出したエリアにだけプロンプトを反映するという機能があり、これで表情の差分を作ったりするのが楽にできるぞ。
生成に時間がかかるようになるが、常時有効で良いくらいなのでuiconfigをいじってデフォルト有効にしている。
また、設定からSave mask previewsをオンにしておくと、outputでどこを自動認識して補正してくれたのかわかるのでよい。
sd-webui-cutoff
GitHub - hnmr293/sd-webui-cutoff: Cutoff - Cutting Off Prompt Effect
プロンプト内の色の指定を他の要素に移らないようにする拡張機能。
Target tokensにカンマ区切りで他の要素と分離して効かせたい色を入力する必要があって面倒なので、これもuiconfigをいじってデフォルトで値を入れて、さらにデフォルト有効にしている。
multidiffusion-upscaler-for-automatic1111
生成されたイラストを高画質化するための拡張機能。
VRAMの制限に関係なく、大きな画像サイズにアップスケールできる。
Tiled Noise Inversionという機能で、画像の細部を補正できる。
t2iやi2iで画像を生成するときに、Tiled DiffusionやTiled VAEのタブから各種設定できるぞ。
sd-dynamic-thresholding
CFG Scaleの値を高く設定したときに、画像の色が変になったり破綻したりするのを防ぐことができる拡張機能。
EmbeddingsやLoRAなど
EasyNegative
gsdf/Counterfeit-V3.0 · Hugging Face
言わずと知れたNegative Embeddings
みんな使ってる。
ネガティブプロンプト用に開発された特殊なモデルで、この単語をネガティブプロンプト内に記入するだけで、多くのネガティブプロンプトを入力したときと同じような効果が得られるようになる。
EasyNegativeとEasyNegativeV2があるのだが、それぞれの特徴を知っておいた方がよい。
Deep Negative
Deep Negative V1.x - V1 75T | Stable Diffusion Textual Inversion | Civitai
同じく自分がよく使っているNegative Embeddings
flat2、add_detail
画像の陰影、描き込み量を制御できるLoRA
これも非常に多くの人が使っている。
flat2とは逆のadd_detailというLoRAもあり、±を逆にすることでどちらも同じように使える。
epi_noiseoffset
epi_noiseoffset - v2 | Stable Diffusion LoRA | Civitai
画像のコントラストを制御するLoRA
flat2やadd_detailなどと併用することでいい感じになってる気がしている。
EnvyBetterHands
AIが苦手とする手の形を補正してくれるLyCORIS
なんやかんやして手の形を補正してくれるものの中ではかなり優秀。
説明に書いてあるがプロンプトにnice hands, perfect handsなどを入れるとよい。
その他オススメLoRA集
マジでありがたいLoRAまとめ↓
あなたの性癖の為のLoraリンク集|にきもなか
イラストの修正・補正
イラストの修正や補正を行う便利機能やツール。
拡張機能
sd-webui-controlnet
GitHub - Mikubill/sd-webui-controlnet: WebUI extension for ControlNet
言わずと知れた ControlNet
生成されるイラストのポーズを参考画像や棒人間などで指定できるようにする神拡張機能。
様々な機能があるから使い方を勉強しよう。
sd-webui-depth-lib
ControlNetのDepthを使って、手の修正を補助してくれる拡張機能。
これは使い方とか含めてわかりやすい解説動画を観た方がよい。
sd-webui-inpaint-anything
生成されたイラストの一部を消したり修正したりできるようにする拡張機能。
まぁこれも解説動画を探して観るのがよい。
便利ツール(WebUIの拡張機能ではない)
Lama Cleaner
画像の中の不要な部分を消したり、欠けた部分を埋めたりすることができるとんでもない便利ツール。
しかも無料でダウンロードできて、Photoshopなどの高価なソフトウェアを持っていなくても、画像の修正が簡単にできてしまう。
Transparent-Background
コマンドライン操作の背景切り抜きツール。
無料で高機能な背景切り抜きができてしまう。
インストール方法や使い方は解説動画を観るとよい。
PoseMY.Art
PoseMy.Art | Free tool to create reference poses with 3D models.
3Dモデルを使ってポーズを作成できる無料のオンラインツール。
会員登録も不要で、人形をいじくりまわしてControlNet用の画像を作成することができるぞ。
プロンプト生成の補助
プロンプト力を高める。
拡張機能
a1111-sd-webui-tagcomplete
プロンプトの入力を自動補完してくれる拡張機能。
プロンプトにタグを入力するときに、候補を表示してくれる。
候補は、Danbooruやe621などのイラストサイトから取得したもので、これらのタグが使われているモデルが多く大体機能する。
設定画面から表示数や言語などを変更するとよい。
stable-diffusion-webui-daam
GitHub - toriato/stable-diffusion-webui-daam: DAAM for Stable Diffusion Web UI
生成されたイラストのどこにプロンプトが効いているのかをヒートマップで可視化できるようにする拡張機能。
上手く動かないことがあるし正直あまり使ってはいないが、プロンプトから余計な単語を排除してより洗練したいときには役立つと思う。
stable-diffusion-webui-wd14-tagger
GitHub - toriato/stable-diffusion-webui-wd14-tagger: Labeling extension for Automatic1111's Web UI
画像からプロンプトを抽出することができる拡張機能。
画像をドラッグアンドドロップするだけで、画像に含まれる要素をタグとして出力できる。
そしてボタンひとつでプロンプトをt2iやi2iに送ることができる
stable-diffusion-webui-two-shot
生成されるイラストのキャラクターをプロンプトに含まれる複数のフレーズに対応させることができる拡張機能。
画面を分割してキャラクターを描き分けることができる。
ひとつのイラスト内に複数のキャラクターがいて、それぞれにプロンプトに指定して反映させたいという場合に必須。
sd-webui-neutral-prompt
GitHub - ljleb/sd-webui-neutral-prompt: Collision-free AND keywords for a1111 webui!
矛盾したプロンプトを上手く調和して画像を生成できるようになる拡張機能。
AND_PERPというキーワードを使って、矛盾したプロンプトを指定できるようになる。
sd-webui-prompt-all-in-one
プロンプトの入力を補助する様々な機能を提供する拡張機能。
日本語のヘルプがついていて使い方は見ればすぐにわかると思う。
超便利なのでとりあえず入れておけ。
ChatGPTの活用
ChatGPTやBingChatなどに、プロンプトの生成を補助してもらうのがよい。