Novita AI 上的 Qwen-Image-Edit:專業級影像編輯,每張僅需 0.02 美元

Novita AI 上的 Qwen-Image-Edit:專業級影像編輯,每張僅需 0.02 美元

Novita AI 自豪宣布推出其**Qwen-Image-Edit 服務,由 200 億參數的 Qwen-Image 模型驅動,提供專業級影像編輯功能,現在僅需每張 0.02 美元**即可使用。

透過結合語意控制(Qwen2.5-VL)與外觀控制(VAE 編碼器),Qwen-Image-Edit 能實現精準、靈活且高效的編輯。從 IP 轉換、風格變更,到中英文雙語的地化文字編輯,再到細緻的外觀調整——Novita AI 以實惠的價格,將最先進的影像編輯完整功能融入您的工作流程。

什麼是 Qwen-Image-Edit

https://www.youtube.com/watch?v=iw9WiAjNl7U

Qwen-Image-Edit 架構

Qwen-Image-Edit 是 200 億參數 Qwen-Image 模型的影像編輯變體,它將 Qwen-Image 先進的文字渲染能力延伸至編輯任務。採用雙路徑輸入設計:將來源影像同時傳入 Qwen2.5-VL(用於語意控制)和 VAE 編碼器(用於外觀控制),實現精準且靈活的編輯。

1. Qwen2.5-VL 路徑(語意控制)

  • 核心功能:Qwen2.5-VL 是 Qwen 系列中的多模態視覺語言模型,專注於理解文字提示與影像的整體語意。
  • 實現能力:提供高階語意控制——例如變更風格、替換物體、旋轉視角等,同時確保編輯過程中的語意一致性。

2. VAE 編碼器路徑(外觀控制)

  • 核心功能:變分自編碼器(VAE)是生成模型中常用的影像編碼器,能將輸入影像壓縮為潛在表徵。
  • 實現能力
    • 保留原始影像的低階細節(色彩、紋理、局部形狀)。
    • 確保局部編輯時未修改的區域完全保持一致,避免「溢出色」效應或無關區域的意外變更。

Qwen-Image-Edit 在保持角色一致性的同時,能實現多樣化的更新,展現其強大能力。

Qwen-Image-Edit 在保持角色一致性的同時,能實現多樣化的更新。

Qwen-Image-Edit 的功能有哪些?

1. 語意編輯 支援 IP 轉換、物體旋轉(包含新穎的 90°/180° 視角合成)、風格變更等重大轉換,同時保持語意一致性。

IP 轉換

IP 轉換

物體旋轉

物體旋轉

風格變更

風格變更

2. 外觀編輯 支援新增、刪除或修改視覺元素(例如新增帶反射的招牌、刪除雜亂的髮絲、變更服裝或背景),同時保持未修改區域完全完整。

將「n」的顏色修改為藍色

將「n」的顏色修改為藍色

調整服裝

調整服裝

3. 精準文字編輯 支援在影像中插入、刪除或修改中英文雙語文字,同時保留字體、大小與整體視覺風格,非常適合在地化的海報或標題編輯。

英文

英文

中文

中文

Qwen-Image-Edit 基準測試

Qwen-Image-Edit 基準測試

資料來源:Artificial Amalysis

Qwen-Image-Edit 的系統需求是什麼?

Qwen 推出了原始 Qwen/Qwen-Image-Edit BF16 權重的 DFloat11 無損壓縮版本,模型大小減少約 32%,同時輸出結果位元完全相同,並能實現高效的 GPU 推論。使用 DFloat11 後,Qwen-Image-Edit 可在單張 32GB 的 GPU 上運行,或在單張 24GB GPU 搭配 CPU 卸載的情況下運行,完全不損失品質。

在您自己的 Novita AI GPU 實例上運行 Qwen-Image-Edit,以超低成本開始構建您的 AI 應用程式吧:

  • RTX 5090(32GB 顯存) — 16 核 vCPU,96GB 記憶體 — 每小時 0.50 美元
  • L40S(48GB 顯存) — 28 核 vCPU,125GB 記憶體 — 每小時 0.55 美元
  • A100 SXM(80GB 顯存) — 14 核 vCPU,240GB 記憶體 — 每小時 1.60 美元
  • H100 SXM(80GB 顯存) — 16 核 vCPU,128GB 記憶體 — 每小時 1.80 美元

一鍵部署,每個實例最高可擴展至 8 張 GPU,並可完全掌控您的環境——非常適合快速原型開發或生產工作負載。

開始部署您的實例

Qwen-Image-Edit 與 Stable Diffusion、Nano Banana、DALL·E 4、Photoshop 的比較

功能 / 工具 Qwen-Image-Edit Stable Diffusion Nano Banana DALL·E 4 Photoshop
易用性 以文字提示進行編輯,即插即用 靈活但需要調整提示詞 在 Google 生態系中非常易用 需要專業訂閱 學習曲線陡峭;需手動操作工具
編輯風格 精準的語意與外觀編輯;文字處理能力優秀 適合生成/修補任務 可整合各種元素 非常適合構思、廣告概念與藝術創作 手動控制;可靠但需大量手動操作
速度 生成速度較慢;取決於硬體 生成速度較慢;取決於硬體 非常快速 約 1 分鐘 手動工作流程速度非常快
文字編輯能力 優秀——支援中英文雙語 較差;尤其對中文或複雜版面支援不佳 未提及 精準度不高 優秀(若有對應字體/元素)
  1. 若你需要精準的文字編輯(招牌、海報、雙語內容)

    • Qwen-Image-Edit → 最佳選擇。能精準處理英文 + 中文文字,保留字體/風格,無縫編輯文字。
    • Stable Diffusion / DALL·E 4 → 難以生成精準的文字。
    • Photoshop → 若你已有對應字體/元素且不介意手動編輯,則可使用。
  2. 若你優先考慮速度與便利性

    • Nano Banana → 速度極快,在 Google 生態系中非常易用。非常適合快速迭代、保持角色一致性,以及消費級工作流程。
    • Photoshop → 可即時進行手動編輯(若你熟練操作)。
    • Qwen-Image-Edit / Stable Diffusion → 生成速度較慢,依賴硬體效能。
    • DALL·E 4 → 每張影像耗時約 1 分鐘,若需要快速產出則不適合。
  3. 若你需要創意發想、概念設計與概念藝術

    • DALL·E 4 → 非常適合廣告概念、藝術風格探索與創意發想
    • Stable Diffusion → 若願意調整提示詞或微調模型,非常適合影像修補與風格混合
    • Qwen-Image-Edit → 更擅長精準編輯,而非自由形式的創意創作。
    • Photoshop → 有創意但需手動操作,大規模發想時速度較慢。
  4. 若你需要精準的局部編輯與專業控制

    • Qwen-Image-Edit → 非常適合語意編輯 + 外觀保留,例如換裝、移除細節、旋轉物體等任務。
    • Photoshop像素級手動控制的黃金標準。
    • Nano Banana / DALL·E 4 → 較不適合細緻的局部控制。
  5. 若易用性是你最優先的考量

    • Nano Banana → 最簡單,內建於 Google 生態系,使用門檻低。
    • Qwen-Image-Edit → 以提示詞驅動,即插即用。
    • Stable Diffusion → 需要模型管理與提示詞專業知識。
    • Photoshop → 學習曲線陡峭,需大量手動操作。

立即嘗試 Qwen-Image-Edit!

Qwen-Image-Edit 是否適合專業使用?

Qwen-Image-Edit 能輸出工作室級別的成果,非常適合專業攝影、行銷素材與商業設計專案。

基準測試表現:公開發表的結果顯示,它在多項編輯基準測試中達到最先進的精準度,驗證了其在高要求工作流程中的一致性和可靠性。

細緻編輯能力:正如 VentureBeat 所指出的,它*「能與 Photoshop 分庭抗禮」*,在海報、招牌、T 恤、書法等文字精準度要求高的細緻任務上表現優異。

文字編輯優勢:與多數生成模型不同,它支援中英文雙語精準文字編輯,能保留字體、大小與風格——這對於廣告活動、品牌素材等在地化商業內容至關重要。

Qwen-Image-Edit 最佳實踐

Novita 推出了 Qwen-Image-Edit API,定價僅為每張 0.02 美元。

步驟 1:登入並存取模型庫 登入您的帳號,點擊模型庫按鈕。

Log In and Access the Model Library

步驟 2:選擇模型 瀏覽可用的選項,選擇符合您需求的模型。

Step 2: Choose Your Model

步驟 3:取得 API 金鑰 要透過 API 進行驗證,我們會提供給您新的 API 金鑰。進入「設定」頁面,即可按照圖片指示複製 API 金鑰。

get api key

步驟 4:安裝 API 使用對應程式語言的套件管理器安裝 API。

Try Qwen-Image-Edit Now!

立即嘗試 Qwen-Image-Edit!

安裝完成後,將必要的函式庫匯入您的開發環境。使用您的 API 金鑰初始化 API,即可開始與 Novita AI LLM 互動。以下為 Python 使用者使用聊天完成 API 的範例。

Vidu 2.0 Image to Video API Example

import requests

url = "https://api.novita.ai/v3/async/qwen-image-edit"

payload = {
    "prompt": "<string>",
    "image": "<string>",
    "seed": 123,
    "output_format": "<string>"
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.json())

提取影像 URL

import requests

url = "https://api.novita.ai/v3/async/task-result"

headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.get(url, headers=headers)

print(response.json())

隨著 Qwen-Image-Edit 的發布,Novita AI 降低了專業影像編輯的門檻。僅需每張 0.02 美元,創作者、開發者與企業現在就能使用能與傳統工具如 Photoshop 匹敵的工作室級編輯功能,同時在自動化、雙語文字處理與語意精準度方面擁有獨特優勢。

立即嘗試 Qwen-Image-Edit,解開智慧影像編輯的未來。

常見問題

Qwen-Image-Edit 與其他 AI 編輯器有什麼不同? Qwen-Image-Edit 採用雙路徑架構:語意編輯(高階變更如風格轉換、IP 轉換、物體旋轉)與外觀編輯(局部修改且不損壞未修改區域)。與多數模型不同的是,它還支援精準雙語文字編輯,非常適合海報與商業素材的編輯。

Qwen-Image-Edit 的費用是多少? Novita AI 透過 API 提供 Qwen-Image-Edit,每張僅需 0.02 美元,是市面上最實惠的專業級影像編輯解決方案之一。

Qwen-Image-Edit 是否適合專業使用? 是的。Qwen-Image-Edit 能輸出工作室級別的成果,經基準測試驗證,並在行銷設計、海報編輯、T 恤/書法文字精準度等專業場景中表現優異。

Novita AI 是滿足您 AI 抱負的全方位雲端平台。整合 API、無伺服器、GPU 實例——您需要的成本效益工具。免除基礎設施煩惱,免費開始,將您的 AI 願景化為現實。

推薦閱讀

Qwen Image Edit VS Nano Banana:詳細使用者對比與免動手操作指南

Novita AI 上的 PixVerse V4.5 T2V:打造電影級 AI 影片的最便宜方式

在消費級硬體上釋放 Wan 2.2 I2V 的強大效能