阿里 Qwen-Image-Edit-2511：新一代图像编辑模型，人物一致性大幅提升

图像编辑

Qwen-Image-Edit-2511 是阿里 Qwen 团队开源的图像编辑大模型，能在任意创意操作中精准保持人物面部特征，并支持多人、多物体、光影等复杂场景的高保真编辑。

链接直达手机查看

Qwen-Image-Edit-2511 是阿里 Qwen 团队开源的图像编辑大模型，能在任意创意操作中精准保持人物面部特征，并支持多人、多物体、光影等复杂场景的高保真编辑。

1. 主要功能

2. 技术原理

ID-preserving Diffusion：
- 在扩散去噪网络中引入“身份锚点”分支，实时比对原图 Face Embedding，梯度锁定关键特征层，确保每一步去噪不漂离原始身份。
Multi-face Tokenizer：
- 自研多人脸同步编码器，单图最多支持 9 张人脸并行 token 化，交叉注意力掩码隔离，实现“谁改谁、不改谁”的细粒度控制。
LoRA-in-the-loop：
- 将轻量 LoRA 权重直接集成在推理流程，用户无需额外训练，模型自动选择最契合的风格或光影 LoRA，一键输出专业效果。
Lighting-aware ControlNet：
- 新增法线图与光照图双通道条件输入，保证新增物体或材质与原图高光、阴影、色温完全匹配。
两阶段训练策略：
- 先在大规模“人脸-文本”对上做身份保持预训练，再在 2000 万张高质量电商、设计、电影剧照上做多场景微调，兼顾泛化与精度。

3. 应用场景

4. 使用方法

网页体验：
打开 HuggingFace Space https://huggingface.co/spaces/Qwen/Qwen-Image-Edit-2511 → 上传图片 → 输入简单中文或英文指令（如“把左边女孩的衣服换成红色旗袍，保持她的脸不变”）→ 点击 Generate，约 5–15 秒返回结果，可多次迭代。
本地部署：
- 环境：Python≥3.9，PyTorch≥2.1，CUDA≥11.8，显存 12G 及以上。
- 拉取代码：git clone https://github.com/QwenLM/Qwen-Image-Edit-2511
- 安装依赖：pip install -r requirements.txt
- 下载模型权重：huggingface-cli download Qwen/Qwen-Image-Edit-2511 --local-dir ./ckpt
- 命令行推理：python edit.py --input img.jpg --prompt "add cyberpunk background, keep all faces" --output result.png
- Gradio UI：python app.py 浏览器自动打开交互界面，支持批量上传、参数滑块、历史记录。
API 调用：
官方提供标准 RESTful 接口，注册阿里云 PAI 即可获得免费 1000 次调用额度，返回 base64 图片，方便嵌入小程序、APP、Web 后台。

5. 适用人群

6. 优缺点介绍

优点：

缺点：

图像编辑、人像精修、多人合照、AI修图、扩散模型、开源工具、阿里云、Qwen、LoRA、身份保持