Novita AI 自豪宣布推出其**Qwen-Image-Edit 服務,由 200 億參數的 Qwen-Image 模型驅動,提供專業級影像編輯功能,現在僅需每張 0.02 美元**即可使用。
透過結合語意控制(Qwen2.5-VL)與外觀控制(VAE 編碼器),Qwen-Image-Edit 能實現精準、靈活且高效的編輯。從 IP 轉換、風格變更,到中英文雙語的地化文字編輯,再到細緻的外觀調整——Novita AI 以實惠的價格,將最先進的影像編輯完整功能融入您的工作流程。
什麼是 Qwen-Image-Edit?
https://www.youtube.com/watch?v=iw9WiAjNl7U
Qwen-Image-Edit 架構
Qwen-Image-Edit 是 200 億參數 Qwen-Image 模型的影像編輯變體,它將 Qwen-Image 先進的文字渲染能力延伸至編輯任務。採用雙路徑輸入設計:將來源影像同時傳入 Qwen2.5-VL(用於語意控制)和 VAE 編碼器(用於外觀控制),實現精準且靈活的編輯。
1. Qwen2.5-VL 路徑(語意控制)
- 核心功能:Qwen2.5-VL 是 Qwen 系列中的多模態視覺語言模型,專注於理解文字提示與影像的整體語意。
- 實現能力:提供高階語意控制——例如變更風格、替換物體、旋轉視角等,同時確保編輯過程中的語意一致性。
2. VAE 編碼器路徑(外觀控制)
- 核心功能:變分自編碼器(VAE)是生成模型中常用的影像編碼器,能將輸入影像壓縮為潛在表徵。
- 實現能力:
- 保留原始影像的低階細節(色彩、紋理、局部形狀)。
- 確保局部編輯時未修改的區域完全保持一致,避免「溢出色」效應或無關區域的意外變更。

Qwen-Image-Edit 在保持角色一致性的同時,能實現多樣化的更新。
Qwen-Image-Edit 的功能有哪些?
1. 語意編輯 支援 IP 轉換、物體旋轉(包含新穎的 90°/180° 視角合成)、風格變更等重大轉換,同時保持語意一致性。

IP 轉換

物體旋轉

風格變更
2. 外觀編輯 支援新增、刪除或修改視覺元素(例如新增帶反射的招牌、刪除雜亂的髮絲、變更服裝或背景),同時保持未修改區域完全完整。

將「n」的顏色修改為藍色

調整服裝
3. 精準文字編輯 支援在影像中插入、刪除或修改中英文雙語文字,同時保留字體、大小與整體視覺風格,非常適合在地化的海報或標題編輯。

英文

中文
Qwen-Image-Edit 基準測試

資料來源:Artificial Amalysis
Qwen-Image-Edit 的系統需求是什麼?
Qwen 推出了原始 Qwen/Qwen-Image-Edit BF16 權重的 DFloat11 無損壓縮版本,模型大小減少約 32%,同時輸出結果位元完全相同,並能實現高效的 GPU 推論。使用 DFloat11 後,Qwen-Image-Edit 可在單張 32GB 的 GPU 上運行,或在單張 24GB GPU 搭配 CPU 卸載的情況下運行,完全不損失品質。
在您自己的 Novita AI GPU 實例上運行 Qwen-Image-Edit,以超低成本開始構建您的 AI 應用程式吧:
- RTX 5090(32GB 顯存) — 16 核 vCPU,96GB 記憶體 — 每小時 0.50 美元
- L40S(48GB 顯存) — 28 核 vCPU,125GB 記憶體 — 每小時 0.55 美元
- A100 SXM(80GB 顯存) — 14 核 vCPU,240GB 記憶體 — 每小時 1.60 美元
- H100 SXM(80GB 顯存) — 16 核 vCPU,128GB 記憶體 — 每小時 1.80 美元
一鍵部署,每個實例最高可擴展至 8 張 GPU,並可完全掌控您的環境——非常適合快速原型開發或生產工作負載。
Qwen-Image-Edit 與 Stable Diffusion、Nano Banana、DALL·E 4、Photoshop 的比較
| 功能 / 工具 | Qwen-Image-Edit | Stable Diffusion | Nano Banana | DALL·E 4 | Photoshop |
|---|---|---|---|---|---|
| 易用性 | 以文字提示進行編輯,即插即用 | 靈活但需要調整提示詞 | 在 Google 生態系中非常易用 | 需要專業訂閱 | 學習曲線陡峭;需手動操作工具 |
| 編輯風格 | 精準的語意與外觀編輯;文字處理能力優秀 | 適合生成/修補任務 | 可整合各種元素 | 非常適合構思、廣告概念與藝術創作 | 手動控制;可靠但需大量手動操作 |
| 速度 | 生成速度較慢;取決於硬體 | 生成速度較慢;取決於硬體 | 非常快速 | 約 1 分鐘 | 手動工作流程速度非常快 |
| 文字編輯能力 | 優秀——支援中英文雙語 | 較差;尤其對中文或複雜版面支援不佳 | 未提及 | 精準度不高 | 優秀(若有對應字體/元素) |
-
若你需要精準的文字編輯(招牌、海報、雙語內容)
- ✅ Qwen-Image-Edit → 最佳選擇。能精準處理英文 + 中文文字,保留字體/風格,無縫編輯文字。
- ❌ Stable Diffusion / DALL·E 4 → 難以生成精準的文字。
- ✅ Photoshop → 若你已有對應字體/元素且不介意手動編輯,則可使用。
-
若你優先考慮速度與便利性
- ✅ Nano Banana → 速度極快,在 Google 生態系中非常易用。非常適合快速迭代、保持角色一致性,以及消費級工作流程。
- ✅ Photoshop → 可即時進行手動編輯(若你熟練操作)。
- ❌ Qwen-Image-Edit / Stable Diffusion → 生成速度較慢,依賴硬體效能。
- ❌ DALL·E 4 → 每張影像耗時約 1 分鐘,若需要快速產出則不適合。
-
若你需要創意發想、概念設計與概念藝術
- ✅ DALL·E 4 → 非常適合廣告概念、藝術風格探索與創意發想。
- ✅ Stable Diffusion → 若願意調整提示詞或微調模型,非常適合影像修補與風格混合。
- ❌ Qwen-Image-Edit → 更擅長精準編輯,而非自由形式的創意創作。
- ❌ Photoshop → 有創意但需手動操作,大規模發想時速度較慢。
-
若你需要精準的局部編輯與專業控制
- ✅ Qwen-Image-Edit → 非常適合語意編輯 + 外觀保留,例如換裝、移除細節、旋轉物體等任務。
- ✅ Photoshop → 像素級手動控制的黃金標準。
- ❌ Nano Banana / DALL·E 4 → 較不適合細緻的局部控制。
-
若易用性是你最優先的考量
- ✅ Nano Banana → 最簡單,內建於 Google 生態系,使用門檻低。
- ✅ Qwen-Image-Edit → 以提示詞驅動,即插即用。
- ❌ Stable Diffusion → 需要模型管理與提示詞專業知識。
- ❌ Photoshop → 學習曲線陡峭,需大量手動操作。
Qwen-Image-Edit 是否適合專業使用?
Qwen-Image-Edit 能輸出工作室級別的成果,非常適合專業攝影、行銷素材與商業設計專案。
基準測試表現:公開發表的結果顯示,它在多項編輯基準測試中達到最先進的精準度,驗證了其在高要求工作流程中的一致性和可靠性。
細緻編輯能力:正如 VentureBeat 所指出的,它*「能與 Photoshop 分庭抗禮」*,在海報、招牌、T 恤、書法等文字精準度要求高的細緻任務上表現優異。
文字編輯優勢:與多數生成模型不同,它支援中英文雙語精準文字編輯,能保留字體、大小與風格——這對於廣告活動、品牌素材等在地化商業內容至關重要。
Qwen-Image-Edit 最佳實踐
Novita 推出了 Qwen-Image-Edit API,定價僅為每張 0.02 美元。
步驟 1:登入並存取模型庫 登入您的帳號,點擊模型庫按鈕。

步驟 2:選擇模型 瀏覽可用的選項,選擇符合您需求的模型。

步驟 3:取得 API 金鑰 要透過 API 進行驗證,我們會提供給您新的 API 金鑰。進入「設定」頁面,即可按照圖片指示複製 API 金鑰。

步驟 4:安裝 API 使用對應程式語言的套件管理器安裝 API。

安裝完成後,將必要的函式庫匯入您的開發環境。使用您的 API 金鑰初始化 API,即可開始與 Novita AI LLM 互動。以下為 Python 使用者使用聊天完成 API 的範例。
Vidu 2.0 Image to Video API Example
import requests
url = "https://api.novita.ai/v3/async/qwen-image-edit"
payload = {
"prompt": "<string>",
"image": "<string>",
"seed": 123,
"output_format": "<string>"
}
headers = {
"Content-Type": "<content-type>",
"Authorization": "<authorization>"
}
response = requests.post(url, json=payload, headers=headers)
print(response.json())
提取影像 URL
import requests
url = "https://api.novita.ai/v3/async/task-result"
headers = {
"Content-Type": "<content-type>",
"Authorization": "<authorization>"
}
response = requests.get(url, headers=headers)
print(response.json())
隨著 Qwen-Image-Edit 的發布,Novita AI 降低了專業影像編輯的門檻。僅需每張 0.02 美元,創作者、開發者與企業現在就能使用能與傳統工具如 Photoshop 匹敵的工作室級編輯功能,同時在自動化、雙語文字處理與語意精準度方面擁有獨特優勢。
立即嘗試 Qwen-Image-Edit,解開智慧影像編輯的未來。
常見問題
Qwen-Image-Edit 與其他 AI 編輯器有什麼不同? Qwen-Image-Edit 採用雙路徑架構:語意編輯(高階變更如風格轉換、IP 轉換、物體旋轉)與外觀編輯(局部修改且不損壞未修改區域)。與多數模型不同的是,它還支援精準雙語文字編輯,非常適合海報與商業素材的編輯。
Qwen-Image-Edit 的費用是多少? Novita AI 透過 API 提供 Qwen-Image-Edit,每張僅需 0.02 美元,是市面上最實惠的專業級影像編輯解決方案之一。
Qwen-Image-Edit 是否適合專業使用? 是的。Qwen-Image-Edit 能輸出工作室級別的成果,經基準測試驗證,並在行銷設計、海報編輯、T 恤/書法文字精準度等專業場景中表現優異。
Novita AI 是滿足您 AI 抱負的全方位雲端平台。整合 API、無伺服器、GPU 實例——您需要的成本效益工具。免除基礎設施煩惱,免費開始,將您的 AI 願景化為現實。
推薦閱讀
Qwen Image Edit VS Nano Banana:詳細使用者對比與免動手操作指南
