本地4G显存部署qwen-image-edit生图模型

1个月前发布

qwen-image-edit是千问最新推出的20B的图像编辑模型，正常部署大致需要60G显存以上。魔塔社区更新的DiffSynth库，支持qwen-image-edit模型以最低显存运行，本人亲自测试，只需要4G显存就可以运行qwen-image-edit模型。

1）下载模型

下载地址：Qwen-Image-Edit

2）下载库

本文的主角就是DiffSynth库，可到github上打包下载：
github.com/modelscope/DiffSynth-Studio

3）显存管理

DiffSynth-Studio 为 Qwen-Image 模型提供了细粒度的显存管理，让模型能够在低显存设备上进行推理，可通过以下代码开启 offload 功能，在显存有限的设备上将部分模块 offload 到内存中。FP8 量化功能也是支持的。

path1 = ["E:/Models/Qwen/Qwen-Image-Edit/transformer/diffusion_pytorch_model-00001-of-00009.safetensors",
"E:/Models/Qwen/Qwen-Image-Edit/transformer/diffusion_pytorch_model-00002-of-00009.safetensors",
"E:/Models/Qwen/Qwen-Image-Edit/transformer/diffusion_pytorch_model-00003-of-00009.safetensors",
"E:/Models/Qwen/Qwen-Image-Edit/transformer/diffusion_pytorch_model-00004-of-00009.safetensors",
"E:/Models/Qwen/Qwen-Image-Edit/transformer/diffusion_pytorch_model-00005-of-00009.safetensors",
"E:/Models/Qwen/Qwen-Image-Edit/transformer/diffusion_pytorch_model-00006-of-00009.safetensors",
"E:/Models/Qwen/Qwen-Image-Edit/transformer/diffusion_pytorch_model-00007-of-00009.safetensors",
"E:/Models/Qwen/Qwen-Image-Edit/transformer/diffusion_pytorch_model-00008-of-00009.safetensors",
"E:/Models/Qwen/Qwen-Image-Edit/transformer/diffusion_pytorch_model-00009-of-00009.safetensors"]
path2 = ["E:/Models/Qwen/Qwen-Image-Edit/text_encoder/model-00001-of-00004.safetensors",
"E:/Models/Qwen/Qwen-Image-Edit/text_encoder/model-00002-of-00004.safetensors",
"E:/Models/Qwen/Qwen-Image-Edit/text_encoder/model-00003-of-00004.safetensors",
"E:/Models/Qwen/Qwen-Image-Edit/text_encoder/model-00004-of-00004.safetensors"]
path3 = "E:/Models/Qwen/Qwen-Image-Edit/vae/diffusion_pytorch_model.safetensors"
path4 = "E:/Models/Qwen/Qwen-Image-Edit/tokenizer/"
path5 = "E:/Models/Qwen/Qwen-Image-Edit/processor/"
pipe = QwenImagePipeline.from_pretrained(
torch_dtype=torch.bfloat16,
device="cuda",
model_configs=[
ModelConfig(path = path1, model_id="Qwen/Qwen-Image-Edit", offload_device="cpu", offload_dtype=torch.float8_e4m3fn),
ModelConfig(path = path2, model_id="Qwen/Qwen-Image-Edit", offload_device="cpu", offload_dtype=torch.float8_e4m3fn),
ModelConfig(path = path3, model_id="Qwen/Qwen-Image-Edit", offload_device="cpu", offload_dtype=torch.float8_e4m3fn),
],
tokenizer_config=None,
processor_config=ModelConfig(path = path5, model_id="Qwen/Qwen-Image-Edit"),
)
pipe.enable_vram_management(vram_limit = 0)