TomePatchModel

(comfyanonymous/ComfyUI)
_for_testing/TomePatchModel
ToMe for SD を有効にする

ToMe for SD (Token Merging for Stable Diffusion) を有効にするための付加データを model に追加します。

U-Net の最外周の self attention block の token について、似た token を平均値一つにまとめることによって計算量を減らし、生成を高速化します。 特に高解像度の場合に効果が高くなります。 ただし、画像の構図が崩れるなどの影響があります。 また、VRAM の実使用量が若干増加します。

ratio はマージ割合です。1.0 で効果が最大になります。

実行時間の実測値

GeForce 3060 で、1024*1024[pixel]、euler、steps 20 でてきとーに計測してみました。

ratio VRAM used elapsed
w/o ToMe 4.0GB 47.9secs
0.00 4.0GB 47.9secs
0.01 4.1GB 49.0secs
0.25 4.1GB 37.3secs
0.50 4.1GB 28.6secs
0.75 4.1GB 23.2secs
1.00 4.1GB 23.2secs