Novita AI 正式推出其 Qwen-Image-Edit 服务,该服务由 200 亿参数的 Qwen-Image 模型提供专业级图像编辑能力,现在每张图像仅需 0.02 美元即可使用。
通过结合语义控制(Qwen2.5-VL)与外观控制(VAE 编码器),Qwen-Image-Edit 能够实现精准、灵活、高效的图像编辑。无论是 IP 转换、风格变换,还是中英文本地化文本编辑、细粒度外观调整,Novita AI 都以实惠的价格将最先进的图像编辑能力融入您的工作流。
什么是 Qwen-Image-Edit ?
https://www.youtube.com/watch?v=iw9WiAjNl7U
Qwen-Image-Edit 架构
Qwen-Image-Edit 是 200 亿参数 Qwen-Image 模型的图像编辑变体,它将 Qwen-Image 先进的文本渲染能力拓展到了编辑任务中。该模型采用双路径输入设计:将源图像同时输入 Qwen2.5-VL(用于语义控制)和 VAE 编码器(用于外观控制),从而实现精准、灵活的编辑。
1. Qwen2.5-VL 路径(语义控制)
- 是什么:Qwen2.5-VL 是 Qwen 系列中的多模态视觉-语言模型,专门用于理解文本提示和图像的整体语义。
- 能力范围:实现高层级语义控制,例如风格变换、物体替换、视角旋转等,同时确保编辑过程中的语义一致性。
2. VAE 编码器路径(外观控制)
- 是什么:变分自编码器(VAE)是生成模型中常用的图像编码器,可将输入图像压缩为潜在表示。
- 能力范围:
- 保留原始图像的低级细节(颜色、纹理、局部形状)。
- 确保局部编辑时未修改区域完全保持一致,避免“溢出”效应或无关区域的意外变更。

Qwen-Image-Edit 在保持角色一致性的同时支持多样化更新。
Qwen-Image-Edit 的功能有哪些?
1. 语义编辑
支持 IP 转换、物体旋转(包括新颖的 90°/180° 视角合成)、风格变换等重大转换,同时保持语义一致性。

IP 转换

物体旋转

风格变换
2. 外观编辑
支持添加、删除或修改视觉元素(例如添加带倒影的标识、去除杂毛、更换服装或背景),同时保证未修改区域完全保持原样。

将字母“n”的颜色修改为蓝色

调整服装
3. 精准文本编辑
支持在图像中进行中英文双语文本的插入、删除或修改,同时保留字体、字号和整体视觉风格,非常适合本地化海报或标题的编辑需求。

英文

中文
Qwen-Image-Edit 基准测试

数据来源:Artificial Amalysis
Qwen-Image-Edit 的系统要求是什么?
Qwen 对原始 Qwen/Qwen-Image-Edit BF16 权重进行了 DFloat11 无损压缩,模型体积减小约 32%,同时输出结果与原始版本完全一致,还能提升 GPU 推理效率。经过 DFloat11 压缩后,Qwen-Image-Edit 可在单张 32GB 显存的 GPU 上运行,也可在单张 24GB 显存 GPU 配合 CPU 卸载的模式下运行,且没有任何质量损失。
现在可以以极低成本在您自己的 Novita AI GPU 实例上运行 Qwen-Image-Edit,即刻开始构建您的 AI 应用:
- RTX 5090(32GB 显存) — 16 核 vCPU,96GB 内存 — 0.5 美元/小时
- L40S(48GB 显存) — 28 核 vCPU,125GB 内存 — 0.55 美元/小时
- A100 SXM(80GB 显存) — 14 核 vCPU,240GB 内存 — 1.6 美元/小时
- H100 SXM(80GB 显存) — 16 核 vCPU,128GB 内存 — 1.8 美元/小时
一键部署,单实例最多可扩展至 8 张 GPU,您可完全掌控运行环境,非常适合快速原型开发或生产级工作负载。
Qwen-Image-Edit 与 Stable Diffusion、Nano Banana、DALL·E 4、Photoshop 对比
| 功能 / 工具 | Qwen-Image-Edit | Stable Diffusion | Nano Banana | DALL·E 4 | Photoshop |
|---|---|---|---|---|---|
| 易用性 | 支持通过文本提示词即插即用进行编辑 | 灵活性高,但需要调整提示词 | 在谷歌生态中极易使用 | 需要专业订阅 | 学习曲线陡峭,需手动操作工具 |
| 编辑风格 | 精准的语义与外观编辑,文本处理能力出色 | 擅长生成与局部重绘 | 可集成多种元素 | 非常适合创意构思、广告概念和艺术创作 | 手动控制,可靠但需大量手动操作 |
| 速度 | 生成速度较慢,依赖硬件 | 生成速度较慢,依赖硬件 | 非常快 | 约 1 分钟 | 手动工作流速度非常快 |
| 文本编辑能力 | 非常出色,支持中英文双语编辑 | 较差,对中文或复杂布局的支持尤其薄弱 | 未提及 | 准确度不高 | 非常出色(前提是已有对应字体/元素) |
-
如果你需要精准的文本编辑(标识、海报、双语内容)
- ✅ Qwen-Image-Edit → 最佳选择。可精准处理中英文文本,保留字体与样式,实现无缝文本编辑。
- ❌ Stable Diffusion / DALL·E 4 → 难以实现精准文本编辑。
- ✅ Photoshop → 如果你已有对应字体/元素且不介意手动编辑,可使用。
-
如果你优先考虑速度与便捷性
- ✅ Nano Banana → 速度极快,在谷歌生态中极易使用,非常适合快速迭代、保持角色一致性和消费级工作流。
- ✅ Photoshop → 可即时完成手动编辑(如果你熟练使用)。
- ❌ Qwen-Image-Edit / Stable Diffusion → 生成速度慢,依赖硬件。
- ❌ DALL·E 4 → 每张图约需 1 分钟,不适合需要快速出图的场景。
-
如果你需要创意、构思和概念艺术
- ✅ DALL·E 4 → 非常适合广告概念、艺术风格探索和创意构思。
- ✅ Stable Diffusion → 如果你愿意调整提示词或微调模型,可灵活实现局部重绘与风格混合。
- ❌ Qwen-Image-Edit → 更擅长精准编辑,而非自由创意。
- ❌ Photoshop → 有创意但需手动操作,大规模构思时效率较低。
-
如果你需要精准的局部编辑与专业控制
- ✅ Qwen-Image-Edit → 非常适合语义编辑+外观保留,例如更换服装、去除细节、旋转物体等场景。
- ✅ Photoshop → 像素级手动控制的黄金标准。
- ❌ Nano Banana / DALL·E 4 → 不太适合细粒度局部控制。
-
如果易用性是你的首要考量
- ✅ Nano Banana → 最简单,嵌入谷歌生态,使用门槛极低。
- ✅ Qwen-Image-Edit → 基于提示词,即插即用。
- ❌ Stable Diffusion → 需要模型管理和提示词专业知识。
- ❌ Photoshop → 学习曲线陡峭,需大量手动操作。
Qwen-Image-Edit 是否适合专业使用?
Qwen-Image-Edit 可输出影棚级质量的结果,非常适合专业摄影、营销物料和商业设计项目。
基准测试表现:公开结果显示,该模型在多项编辑基准测试中达到了业界顶尖的准确率,验证了其在严苛工作流中的一致性和可靠性。
细粒度编辑:正如 VentureBeat 报道的那样,它“足以与 Photoshop 分庭抗礼”,在海报、标识、T 恤、书法等对文本精度要求极高的精细任务中表现优异。
卓越的文本编辑能力:与多数生成模型不同,它支持中英文双语精准文本编辑,可保留字体、字号和样式,这对于广告活动、品牌资产等本地化商业内容至关重要。
Qwen-Image-Edit 最佳实践
Novita 推出了 Qwen-Image-Edit API,每张图像的定价仅需 0.02 美元。
步骤 1:登录并进入模型库
登录您的账户,点击模型库按钮。

步骤 2:选择模型
浏览可用选项,选择适合您需求的模型。

步骤 3:获取 API 密钥
为了完成 API 身份验证,我们将为您提供新的 API 密钥。进入“设置”页面,即可按照图中指示复制 API 密钥。

步骤 4:安装 API
使用对应编程语言的包管理器安装 API。

安装完成后,将必要的库导入您的开发环境,使用 API 密钥初始化 API,即可开始与 Novita AI 大模型交互。以下是为 Python 用户提供的聊天补全 API 调用示例。
Vidu 2.0 图像转视频 API 示例
import requests
url = "https://api.novita.ai/v3/async/qwen-image-edit"
payload = {
"prompt": "<string>",
"image": "<string>",
"seed": 123,
"output_format": "<string>"
}
headers = {
"Content-Type": "<content-type>",
"Authorization": "<authorization>"
}
response = requests.post(url, json=payload, headers=headers)
print(response.json())
提取图像 URL
import requests
url = "https://api.novita.ai/v3/async/task-result"
headers = {
"Content-Type": "<content-type>",
"Authorization": "<authorization>"
}
response = requests.get(url, headers=headers)
print(response.json())
随着 Qwen-Image-Edit 的发布,Novita AI 降低了专业图像编辑的门槛。创作者、开发者和企业现在仅需每张 0.02 美元,即可使用媲美 Photoshop 等传统工具的影棚级编辑能力,同时还能享受到自动化、双语文本处理、语义精准度等方面的独特优势。
立即试用 Qwen-Image-Edit,开启智能图像编辑的未来。
常见问题
Qwen-Image-Edit 与其他 AI 编辑器有什么区别?
Qwen-Image-Edit 采用双路径架构:语义编辑(风格变换、IP 转换、物体旋转等高层级修改)和外观编辑(局部修改不会破坏未调整区域)。与多数模型不同,它还支持精准双语文本编辑,非常适合海报和商业素材的编辑需求。
Qwen-Image-Edit 的定价是多少?
通过 Novita AI 的 API 使用 Qwen-Image-Edit 每张仅需 0.02 美元,是性价比最高的专业级图像编辑解决方案之一。
Qwen-Image-Edit 是否适合专业使用?
是的。Qwen-Image-Edit 可输出影棚级质量的结果,经过基准测试验证,在营销设计、海报编辑、T 恤/书法文本精度等专业场景中表现备受好评。
Novita AI 是助力您实现 AI 愿景的一站式云平台。集成 API、无服务器、GPU 实例——您需要的性价比工具。无需操心基础设施,免费即可开始,让您的 AI 想法落地。
推荐阅读
Qwen Image Edit 与 Nano Banana 对比:详细用户指南或免操作方案
