Модели Qwen-Image-Edit от Alibaba (20B параметров) и Gemini 2.5 Flash Image от Google (прозванная Nano-Banana) — это две продвинутые модели ИИ для работы с изображениями, запущенные в середине 2025 года.
Qwen-Image-Edit — это модель с открытым исходным кодом, построенная на основе системы генерации Qwen-Image и ориентированная на редактирование изображений по текстовым командам. В отличие от неё, Nano-Banana от Google — проприетарная модель, поддерживающая как генерацию, так и редактирование изображений, доступная через API и интерфейс Gemini.
Обе модели позволяют выполнять сложные трансформации изображений, но существенно различаются по возможностям, качеству результатов, производительности, удобству использования, лицензированию и стоимости. В следующих разделах представлено постатейное сравнение в соответствии с запрошенной структурой.
Qwen-Image-Edit VS Nano Banana: основные возможности
Qwen-Image-Edit специализируется на редактировании изображений по принципу «изображение‑в‑изображение» (входное изображение + текстовая инструкция → изменённое изображение). Поддерживает инпейнтинг (добавление/удаление объектов) и ограниченный аутпейнтинг. Генерация текста в изображение выполняется отдельно моделью Qwen-Image. Nano Banana умеет генерировать изображения по текстовым запросам, редактировать существующие изображения и выполнять многоснимковую слияние (объединение нескольких фотографий).
| Категория | Qwen-Image-Edit | Nano-Banana |
|---|---|---|
| Семантическое редактирование | Да — поворот объектов (даже на 90°/180° с нестандартными ракурсами), перенос стиля, преобразование IP. | Да — изменение сцены/стиля, корректировка поз, смешивание нескольких стилей или источников в одном запросе. |
| Редактирование внешнего вида | Да — детальная правка (добавление вывесок с отражениями, удаление выбившихся волос, смена одежды, замена фона). | Да — правка на естественном языке (размыть фон, переместить объекты, изменить цвет элементов). |
| Редактирование текста | Сильная поддержка — точное редактирование английского и китайского текста (вставка/удаление/изменение) с сохранением шрифта, размера и расположения. | Слабая поддержка — не предназначена для надёжного редактирования текста внутри изображения; ведёт себя как большинство генеративных моделей, испытывает трудности с точным размещением текста. |
| Согласованность | Специально спроектирована для согласованности персонажей (например, талисман Qwen в разных нарядах и обстановках). | Сохраняет согласованность объекта при редактировании (лица, животные, объекты) |
Qwen-Image-Edit
- Вы предоставляете одно входное изображение + текстовую инструкцию.
- Она позволяет выборочно добавлять, удалять или изменять определённые объекты или области, оставляя остальное нетронутым.
Nano-Banana
- Может работать только с текстовым запросом, или с одним/несколькими изображениями на входе.
- При многоснимковом слиянии вы можете предоставить несколько фотографий или элементов, а модель решает, как расположить, смешать и разместить эти объекты в связной сцене.
Qwen-Image-Edit VS Nano Banana: качество результатов
- Gemini 2.5 Flash Image — более сильный универсал, особенно превосходен в отрисовке персонажей, креативности и общем предпочтении.
- Qwen Image Edit имеет нишевое преимущество в стилизации, что делает его привлекательным для сценариев, где важнее точность стиля или художественная выразительность.

Однако Banana может быть менее эффективен при генерации текста, и на данный момент конкретных данных нет. Напротив, результаты Qwen на бенчмарках LongText-Bench, ChineseWord и TextCraft показывают, что он превосходен в рендеринге текста — особенно в генерации китайского текста, значительно опережая существующие передовые модели.

Из Qwen
Qwen-Image-Edit VS Nano Banana: скорость
Nano Banana
- Заявленная скорость: ~20 секунд на изображение на серверах Google
- Стабильность: поскольку модель работает исключительно на облачных TPU/GPU Google, скорость для конечных пользователей относительно стабильна.
- Ограничение: пользователи не могут настраивать или оптимизировать производительность локально, так как модель доступна только через API/Studio Google.
Qwen-Image-Edit
- Заявленная скорость: ~20 секунд на одно редактирование на хорошем GPU
- Гибкость: производительность варьируется в зависимости от оборудования (модель GPU, объём VRAM, размер батча, разрешение).
- Локальное и облачное развёртывание: можно запускать локально, если у вас достаточно памяти GPU, или у различных облачных провайдеров.
Это большая модель с 20 миллиардами параметров, требующая значительного объёма памяти GPU. Производительность зависит от выбора развёртывания: модели полной точности требуют более 32 ГБ VRAM, а сжатые или квантованные версии могут работать на 24 ГБ или даже около 16 ГБ VRAM.
Qwen-Image-Edit VS Nano Banana: удобство использования
Интерфейсы / Интеграция
-
Qwen-Image-Edit
- Доступен через Qwen Chat (веб-интерфейс)
- Можно запускать через код, API или демо-интерфейсы.
- Узел Hugging Face или ComfyUI.
-
Nano Banana
- Интегрирован в приложение Gemini (мобильное + веб).
- Доступен разработчикам через Gemini API.
- Появляется на сторонних платформах (OpenRouter.ai, Fal.ai) через Gemini API.
- Открытые веса или узел ComfyUI отсутствуют.
Сложность подсказок
-
Qwen-Image-Edit
- Работает с простыми естественными запросами
- Хорош для итеративного уточнения (шаг за шагом)
-
Nano Banana
- Работает с обычными описательными запросами
- Отмечается за понимание сложных многошаговых запросов за один раз.
Экосистема
-
Qwen-Image-Edit
- Модель с открытым исходным кодом → сообщество может разрабатывать LoRA, ControlNet, GUI.
- Уже есть скрипты Diffusers и примеры рабочих процессов.
- Большой потенциал для расширения сообществом.
-
Nano Banana
- Закрытый исходный код → нет весов или публичного кода.
- Экосистема ограничена Google + партнёрами.
- Существуют некоторые внешние инструменты, но они являются лишь обёртками вокруг API Google.
Qwen-Image-Edit VS Nano Banana: применение
Смена стиля:
преврати это фото в фигурку персонажа. Позади неё помести коробку с изображением персонажа на ней, а рядом компьютер, на экране которого отображается процесс моделирования в Blender. Перед коробкой добавь круглую пластиковую подставку, на которой стоит фигурка

Qwen Image Edit

Nano banana
Редактирование изображения:
Измени небо над мостом на красивые огненные облака


Qwen Image Edit

Nano Banana
Редактирование текста:
Сделай обложку модного журнала с женщиной в красном платье, название журнала — Qwen Image Edit, никакого другого текста

Qwen Image Edit

Nano Banana
Слияние нескольких изображений:

Лучшие практики для Qwen-Image-Edit
Novita запускает API Qwen-Image-Edit по цене всего $0.02 за изображение.
Шаг 1: Войдите в систему и откройте Библиотеку моделей
Войдите в свою учётную запись и нажмите кнопку Библиотека моделей.

Шаг 2: Выберите модель
Просмотрите доступные варианты и выберите модель, которая подходит для ваших задач.

Шаг 3: Получите API-ключ
Для аутентификации через API мы предоставим вам новый API-ключ. Перейдя на страницу «Settings», вы можете скопировать API-ключ, как показано на изображении.

Шаг 4: Установите API
Установите API с помощью менеджера пакетов, соответствующего вашему языку программирования.

Попробуйте Qwen-Image-Edit сейчас!
После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с помощью вашего API-ключа, чтобы начать взаимодействие с Novita AI LLM. Это пример использования API чат-завершений для пользователей Python.
Пример API Qwen-Image-Edit to Video
import requests
url = "https://api.novita.ai/v3/async/qwen-image-edit"
payload = {
"prompt": "<string>",
"image": "<string>",
"seed": 123,
"output_format": "<string>"
}
headers = {
"Content-Type": "<content-type>",
"Authorization": "<authorization>"
}
response = requests.post(url, json=payload, headers=headers)
print(response.json())
Извлечение URL изображения
import requests
url = "https://api.novita.ai/v3/async/task-result"
headers = {
"Content-Type": "<content-type>",
"Authorization": "<authorization>"
}
response = requests.get(url, headers=headers)
print(response.json())
Qwen-Image-Edit от Alibaba и Gemini 2.5 Flash Image (Nano-Banana) от Google представляют два разных подхода к созданию ИИ-изображений следующего поколения в 2025 году.
- Qwen-Image-Edit превосходит в детальном редактировании по текстовым инструкциям (замена объектов, инпейнтинг, редактирование текста, стилизация). Это открытый исходный код, модель легко настраивается и поддерживается расширяющимся сообществом. Его главные сильные стороны — качество стилизации, точное редактирование текста (особенно китайского) и гибкие варианты развёртывания. Однако для работы требуются большие GPU (20B параметров), а производительность зависит от квантования и конфигурации оборудования.
- Nano-Banana (Gemini 2.5 Flash Image) — это закрытая, облачная модель, предназначенная для сквозной генерации и редактирования, включая слияние нескольких изображений. Она показывает высокие результаты по общему предпочтению, креативности и отрисовке персонажей, при этом проста в использовании благодаря экосистеме Google (приложение Gemini, API, Studio, Vertex AI). Её сильные стороны — понимание сложных многошаговых запросов и бесшовная интеграция, но отсутствуют открытые веса, расширенные возможности редактирования текста и инновации от сообщества.
Кратко:
- Qwen-Image-Edit лучше всего подходит для разработчиков открытого кода, исследований и творческих процессов стилизации.
- Nano-Banana лучше всего подходит для сценариев «подключи и работай», профессионального создания контента и приложений, интегрированных с Google.
Часто задаваемые вопросы
Какая модель обладает более высоким общим качеством?
Nano-Banana показывает более высокие оценки по персонажам, креативности и общему предпочтению.
Qwen-Image-Edit конкурентоспособен в большинстве категорий и имеет явное преимущество в стилизации.
Какая модель лучше обрабатывает текст?
Qwen-Image-Edit → сильная поддержка редактирования английского и китайского текста, точный контроль шрифтов и расположения.
Nano-Banana → слабее в рендеринге текста, как и другие генеративные модели, которые испытывают трудности с согласованностью текста.
Какие варианты интеграции существуют?
Qwen-Image-Edit → веб-интерфейс (Qwen Chat), API (Model Studio), веса на Hugging Face, узел ComfyUI.
Nano-Banana → приложение Gemini, Gemini API, Google AI Studio, Vertex AI, сторонние обёртки (OpenRouter, Fal.ai).
Novita AI — это облачная платформа «всё в одном», которая расширяет ваши возможности в области ИИ. Интегрированные API, serverless, GPU-экземпляры — экономически эффективные инструменты, которые вам нужны. Избавьтесь от инфраструктуры, начните бесплатно и воплотите ваше ИИ-видение в реальность.
Рекомендуемое чтение
PixVerse V4.5 T2V на Novita AI: Самый дешёвый способ создания кинематографических ИИ-видео
Раскрытие возможностей Wan 2.2 I2V на потребительском оборудовании
Рынок ИИ-помощников для заметок к видео YouTube 2024 и ведущие игроки
