VAE(Variational Autoencoder)
変分オートエンコーダ (VAE)とは、訓練データの特徴を学習し、似たような画像を作成する生成モデルの一種です。
VAEでピクセル画像を潜在表現に変換することで、モデルの軽量化に成功
512×512サイズのピクセル画像から、8×8サイズの潜在表現に変換されるため、処理の負担が 64分の1 に大幅に軽減されます。
定番VAE一覧
vae-ft-ema-560000-ema-pruned.safetensors
https://huggingface.co/stabilityai/sd-vae-ft-ema-original/tree/main
vae-ft-mse-840000-ema-pruned.safetensors
https://huggingface.co/stabilityai/sd-vae-ft-mse-original/tree/main
どちらもStabilityAI社のもの。アニメ・実写どちらも向いてる