The training details about Unet parameters frozen #129

hda-xian · 2024-06-09T14:03:01Z

Why are the UNet parameters frozen during training for SD1v5, but not for SDXL? the haggingface training sdxl script sets " Unet.train() "

***** huggingface train sdxl *********
vae.requires_grad_(False)
text_encoder_one.requires_grad_(False)
text_encoder_two.requires_grad_(False)
t2iadapter.train()
unet.train()

*******Tencent ARC train sd1v5 **************
model.cuda()
model.eval() # model is contain all models vae ,cliptext
return model

*******Tencent ARC train sdxl **************
vae.requires_grad_(False)
text_encoder_one.requires_grad_(False)
text_encoder_two.requires_grad_(False) -> the Unet does not set no grad means Unet need grad

bonlime · 2024-07-02T20:03:30Z

because they have params_to_optimize = adapter.parameters(), and only optimise the adapter's params. But disabling unet grads reduces the memory consumption, they just forgot it

hda-xian · 2024-07-02T20:04:01Z

这是来自QQ邮箱的假期自动回复邮件。你好，我最近正在休假中，无法亲自回复你的邮件。我将在假期结束后，尽快给你回复。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

The training details about Unet parameters frozen #129

The training details about Unet parameters frozen #129

hda-xian commented Jun 9, 2024

bonlime commented Jul 2, 2024

hda-xian commented Jul 2, 2024 via email

The training details about Unet parameters frozen #129

The training details about Unet parameters frozen #129

Comments

hda-xian commented Jun 9, 2024

bonlime commented Jul 2, 2024

hda-xian commented Jul 2, 2024 via email