阿里巴巴的 Qwen-圖像編輯 (20 億個參數)和Google的 Gemini 2.5 Flash 影像 (暱稱 奈米香蕉) 是兩款將於 2025 年中期推出的先進 AI 影像模型。
Qwen-Image-Edit 是一個開源模型,建立在 Qwen-Image 生成系統之上,專注於文字驅動的圖像編輯。相比之下,Google的 Nano-Banana 是一個專有模型,支援圖像生成和編輯,可透過 Gemini 的 API 和使用者介面使用。
兩種型號都支援豐富的影像轉換,但在功能、輸出品質、效能、可用性、許可和成本方面差異顯著。以下部分將根據所要求的框架進行逐一比較。
Qwen-Image-Edit VS Nano Banana:核心功能
Qwen-Image-Edit 專注於影像到影像的編輯(輸入影像 + 文字指令 → 修改影像)。支援修復(添加/移除物件)和有限的去除修復。文字到圖像的處理由 Qwen-Image 模型單獨處理。但 Nano Banana 可以根據文字指令產生影像,編輯現有影像,並進行多影像融合(合併多張照片)。
| 項目類別 | Qwen-圖像編輯 | 奈米香蕉 |
|---|---|---|
| 語意編輯 | 是的——物體旋轉(甚至是新穎的 90°/180° 視圖)、風格轉換、IP 轉換。 | 是的——場景/風格變化、姿勢調整、在一個提示中混合多種風格或來源。 |
| 外觀編輯 | 是的——細粒度的編輯(添加帶有反射的標誌、去除散落的頭髮、更換衣服、替換背景)。 | 是的──自然語言編輯(模糊背景、重新定位物件、重新著色元素)。 |
| 文字編輯 | 大力支持 — 精確的英文和中文文字編輯(插入/刪除/修改),同時保留字體、大小和佈局。 | 支撐薄弱 — 並非為可靠的圖像內文字編輯而設計;其行為與大多數生成模型類似,難以實現準確的文字佈局。 |
| 一致性 | 專為 角色一致性 (例如 Qwen 吉祥物跨越服裝和設置)。 | 維護 主題一致性 跨編輯(臉部、動物、物體) |
Qwen-圖像編輯
- 您提供一張輸入圖像+一條文字說明。
- 它允許您選擇性地新增、刪除或修改特定物件或區域,同時保持其餘部分不變。
奈米香蕉
- 它可以單獨接受文字提示,也可以接受一張或多張圖像作為輸入。
- 透過多影像融合,您可以提供多張照片或元素,模型決定如何在連貫的場景中排列、混合和放置這些物件。
Qwen-Image-Edit 與 Nano Banana:輸出質量
- Gemini 2.5 Flash Image 是更強大的全能型產品,尤其在角色、創造力和整體偏好方面表現出色。
- Qwen Image Edit 在風格化方面具有獨特優勢,這使得它在風格保真度或藝術表現力更為重要的場景中具有吸引力。

然而,Banana 在文本生成方面可能效果較差,目前尚無確鑿的數據。相較之下,Qwen 在 LongText-Bench、ChineseWord 和 TextCraft 上的結果表明,它在文字渲染方面表現出色,尤其是在中文文字生成方面,遠超現有的頂尖模型。

Qwen-Image-Edit VS Nano Banana:速度
奈米香蕉
- 報告速度: 每張圖片在 Google 伺服器上耗時約 20 秒
- 一致性: 由於它僅在 Google Cloud TPU 上運行/GPUs,對於最終用戶來說速度相對穩定。
- 局限性: 使用者無法在本地調整或最佳化效能,因為該模型只能透過 Google 的 API/Studio 存取。
Qwen-圖像編輯
- 報告速度: 每次編輯約 20 秒 GPU
- 靈活性: 性能取決於硬體(GPU 模型、VRAM 大小、批次大小、解析度)。
- 本地和雲端部署: 如果有足夠的資源,可以在本地運行 GPU 記憶體或各種雲端提供者。
這是一個大型的 20B 參數模型,需要大量 GPU 內存。效能取決於部署選擇:全精度模型需要超過 32GB 的 VRAM,而壓縮或量化版本可以在 24GB 甚至 16GB 左右的 VRAM 上運行。
Qwen-Image-Edit VS Nano Banana:易用性
介面/集成
- Qwen-圖像編輯
- 可透過 Qwen Chat(網頁使用者介面)存取
- 可以透過程式碼、API 或演示 UI 運行。
- 擁抱面或 ComfyUI 節點。
- 奈米香蕉
- 整合到 Google 的 Gemini 應用程式(行動 + 網路)。
- 開發人員可以透過 Gemini API 使用,
- 出現在第三方平台(OpenRouter.透過 Gemini API 開發人工智慧 (AI、Fal.ai)。
- 沒有可用的公共權重或 ComfyUI 節點。
提示難度
- Qwen-圖像編輯
- 處理簡單的自然提示
- 善於迭代改進(逐步)
- 奈米香蕉
- 適用於簡單的描述性提示
- 因能夠一次理解複雜的多步驟提示而聞名。
生態系統
- Qwen-圖像編輯
- 開源模型→社群可以開發 LoRA、ControlNets、GUI。
- 已經有擴散器腳本和範例工作流程。
- 社區驅動擴張的巨大潛力。
- 奈米香蕉
- 閉源 → 沒有權重或公共法典。
- 生態系統僅限於 Google + 合作夥伴。
- 存在一些外部工具,但僅作為 Google API 的包裝器。
Qwen-Image-Edit 與 Nano Banana:應用程式
風格變化:
把這張照片變成一個人物模型。在它後面放一個印有人物圖像的盒子,以及一台顯示 Blender 建模過程的電腦。在盒子前面,放一個圓形塑膠底座,人物模型就站在上面。


圖像編輯:
將橋上空的天空編輯成美麗的火紅雲彩



文字編輯:
製作一個時尚雜誌封面,封面上有一位穿著紅色連身裙的女士,雜誌的標題是 奎文 圖片 編輯,沒有其他 文本


多影像融合:

最佳實踐 Qwen-圖像編輯
Novita 推出 Qwen-Image-Edit API,每張圖片僅需 0.02 美元。
步驟 1:登入並存取模型庫
登入您的帳戶並點擊 模型庫 按鈕。

步驟 2:選擇您的型號
瀏覽可用的選項並選擇適合您需求的型號。

步驟 3:取得您的 API 金鑰
為了透過 API 進行身份驗證,我們將為您提供一個新的 API 金鑰。進入“設定「頁面,您可以按照圖中所示複製API金鑰。

步驟 4:安裝 API
使用特定於您的程式語言的套件管理器安裝 API。

安裝後,將必要的庫匯入到您的開發環境中。使用您的 API 金鑰初始化 API 以開始與 Novita AI LLM。這是 Python 使用者使用聊天完成 API 的範例。
Qwen-Image-Edit 到視訊 API 範例
導入請求 url = "https://api.novita.ai/v3/async/qwen-image-edit」有效載荷={“提示”:“ “, “圖像”: ” ", "種子": 123, "輸出格式": " " } 標題 = { "內容類型": " “, “授權”: ” " } 回應 = 請求.post(url,json=payload,headers=headers)列印(response.json())
擷取圖片 URL
導入請求 url = "https://api.novita.ai/v3/async/task-result」標頭={“Content-Type”:“ “, “授權”: ” " } 回應 = 請求.get(url,headers=headers)列印(response.json())
阿里巴巴的 Qwen-Image-Edit 以及 Google Gemini 2.5 Flash 圖片(Nano-Banana) 代表了2025年新一代影像AI的兩種不同方法。
- Qwen-圖像編輯 擅長 細粒度的文本驅動編輯 (物件替換、修復、文字編輯、風格化)。它是 開放源碼高度可定制,並由不斷擴展的社區生態系統提供支援。其主要優勢包括: 風格化品質, 精確的文字編輯(尤其是中文)以及 靈活部署 選項。然而,它需要 大 GPUs(20B 參數),性能取決於量化和硬體配置。
- 奈米香蕉(Gemini 2.5 Flash 影像) 封閉的、僅限雲的模型 設計用於 端對端生成和編輯,包括 多影像融合. 它在 整體偏好、創意、人物刻畫,同時易於透過 Google 生態系統(Gemini 應用、API、Studio、Vertex AI)使用。其優勢在於 複雜、多步驟的快速理解 以及 無縫整合,但它缺乏開放權重、高級文本編輯功能以及社區驅動的創新。
總之:
- Qwen-圖像編輯 最適合 開源開發人員、研究和創意風格化工作流程.
- 奈米香蕉 最適合 即插即用用例、專業內容創作和 Google 整合應用程式.
常見問題(FAQ)
奈米香蕉 得分較高 角色、創造力和整體偏好.
Qwen-圖像編輯 在大多數類別中具有競爭力,並且 風格化方面的優勢.
Qwen-圖像編輯 → 大力支持 英文和中文文字編輯,精確控製字體和佈局。
奈米香蕉 → 文字渲染能力較弱,類似其他難以實現文字一致性的生成模型。
Qwen-圖像編輯 → Web UI(Qwen Chat)、API(Model Studio)、Hugging Face 權重、ComfyUI 節點。
奈米香蕉 → Gemini 應用程式、Gemini API、Google AI Studio、Vertex AI、第三方包裝器(OpenRouter、Fal.ai)。
Novita AI 是助力您實現 AI 抱負的一體化雲端平台。整合 API、無伺服器、 GPU 實例-您需要的經濟高效的工具。消除基礎設施,免費開始,讓您的 AI 願景成為現實。
推薦閱讀
PixVerse V4.5 T2V 開啟 Novita AI:製作電影級 AI 影片最便宜的方法
2024 年 YouTube 影片筆記 AI 市場及領導企業
探索 Novita 的更多內容
訂閱以將最新貼文發送到您的電子郵件。





