Novita AI ahora ofrece Qwen-Image: modelo avanzado de texto a imagen de 20B con renderizado superior de texto

Novita AI ahora ofrece Qwen-Image: modelo avanzado de texto a imagen de 20B con renderizado superior de texto

Nos complace anunciar que Qwen-Image ya está disponible en Novita AI por solo $0.02 por imagen. Este innovador modelo de imagen base de 20B MMDiT trae avances significativos en renderizado complejo de texto y edición precisa de imágenes a nuestra plataforma de inferencia de IA.

Acerca de Qwen-Image

Qwen-Image es un modelo de imagen base de 20B MMDiT que logra avances significativos en renderizado complejo de texto y edición precisa de imágenes. El modelo representa un gran avance en la tecnología de generación de imágenes impulsada por IA.

Las características clave incluyen:

  • Renderizado superior de texto: Qwen-Image destaca en el renderizado complejo de texto, incluyendo diseños multilínea, semántica a nivel de párrafo y detalles finos. Soporta tanto idiomas alfabéticos (por ejemplo, inglés) como idiomas logográficos (por ejemplo, chino) con alta fidelidad.
  • Edición consistente de imágenes: A través de nuestro paradigma mejorado de entrenamiento multitarea, Qwen-Image logra un rendimiento excepcional al preservar tanto el significado semántico como el realismo visual durante las operaciones de edición.
  • Rendimiento sólido en múltiples benchmarks: Evaluado en varios benchmarks públicos, Qwen-Image supera consistentemente a los modelos existentes en diversas tareas de generación y edición, estableciendo un modelo base fuerte para la generación de imágenes.

Resumen de la arquitectura de Qwen-Image.

Fuente: Informe técnico

Rendimiento probado

Qwen-Image ha sido evaluado exhaustivamente en múltiples benchmarks públicos, incluyendo GenEval, DPG y OneIG-Bench para generación general de imágenes, así como GEdit, ImgEdit y GSO para edición de imágenes. Qwen-Image logra un rendimiento de última generación en todos los benchmarks, demostrando sus fuertes capacidades tanto en generación como en edición de imágenes.

Además, los resultados en LongText-Bench, ChineseWord y TextCraft muestran que sobresale en renderizado de texto, particularmente en generación de texto en chino, superando a los modelos de última generación existentes por un margen significativo. Esto destaca la posición única de Qwen-Image como un modelo líder de generación de imágenes que combina una amplia capacidad general con una precisión excepcional en el renderizado de texto.

benchmark de Qwen-Image

Fuente: 📑 Blog

Accede a Qwen-Image en Novita AI

Como proveedor de inferencia de IA, Novita AI ha integrado Qwen-Image como un modelo MMDiT de 20B para la próxima generación de generación de texto a imagen. El modelo es especialmente potente para crear impresionantes pósters gráficos con texto nativo, lo que lo hace perfecto para aplicaciones profesionales que requieren integración de texto de alta calidad. Para obtener todos los detalles de implementación, consulta nuestra documentación.

Cómo funciona nuestra API

Hemos implementado Qwen-Image como un sistema de API asíncrona. Cuando realizas una solicitud, solo se devolverá el task_id inicialmente. Luego, usas el task_id para solicitar nuestra API de resultados de tarea y recuperar los resultados de generación de imágenes.

Especificaciones de la API

Endpoint: https://api.novita.ai/v3/async/qwen-image-txt2img

Encabezados de la solicitud:

  • Content-Type (cadena, obligatorio): Soporta application/json
  • Authorization (cadena, obligatorio): Formato de autenticación Bearer, por ejemplo: Bearer {{API Key}}

Cuerpo de la solicitud:

  • prompt (cadena, obligatorio): Prompt de texto para la generación de imágenes
  • size (cadena): El tamaño del medio generado en píxeles (ancho*alto). El valor predeterminado es 1024*1024. Rango: 256 ~ 1536 por dimensión

Respuesta:

  • task_id (cadena, obligatorio): Usar el task_id para solicitar nuestra API de resultados de tarea y recuperar las salidas generadas

Primeros pasos con Qwen-Image en Novita AI

Así es como puedes usar Qwen-Image a través de nuestra API:

Paso 1: Generar un task_id

Envía una solicitud POST a nuestra API de Texto a Imagen de Qwen-Image:

Solicitud:

curl --location 'https://api.novita.ai/v3/async/qwen-image-txt2img' \
--header 'Authorization: Bearer {{API Key}}' \
--header 'Content-Type: application/json' \
--data '{
    "prompt": "A cinematic scene of a quiet girl with short brown hair sitting by a misty lake at dawn. She wears an oversized sweater, holding a warm mug. Soft morning light filters through the trees, cool tones, tranquil mood, light fog, 50mm photography style.",
    "size": "1024*1024"
}'

Respuesta:

{
    "task_id": "{Returned Task ID}"
}

Paso 2: Recuperar tus imágenes generadas

Usa el task_id para obtener tus imágenes de salida:

curl --location --request GET 'https://api.novita.ai/v3/async/task-result?task_id={Returned Task ID}' \
--header 'Authorization: Bearer {{API Key}}'

Los códigos de estado HTTP en el rango 2xx indican que la solicitud ha sido aceptada correctamente, mientras que los códigos de estado en el rango 5xx indican errores internos del servidor. Puedes obtener la URL de la imagen en el campo images de la respuesta.

Por qué añadimos Qwen-Image a nuestra plataforma

Como proveedor de inferencia de IA, elegimos integrar Qwen-Image porque aborda una brecha crítica en la generación de imágenes por IA: el renderizado de texto de alta calidad. Ahora nuestros usuarios pueden:

  • Crear pósters gráficos profesionales con texto claro y legible
  • Generar imágenes con diseños de texto multilínea y semántica a nivel de párrafo
  • Soportar texto tanto en inglés como en chino con alta fidelidad
  • Obtener resultados de última generación en múltiples benchmarks de generación de imágenes
  • Acceder a opciones de tamaño flexibles desde 256x256 hasta 1536x1536 píxeles

Demo de Qwen-Image

Monte Fuji con cerezos en flor en primer plano, cielo despejado, día primaveral tranquilo, luz natural suave, paisaje realista.

Un hombre trajeado está de pie frente a la ventana, mirando la luna brillante afuera. El hombre sostiene un papel amarillento con palabras escritas a mano: “A lantern moon climbs through the silver night, Unfurling quiet dreams across the sky, Each star a whispered promise wrapped in light, That dawn will bloom, though darkness wanders by.” Hay un gato lindo en el alféizar de la ventana.

Una joven con uniforme escolar está de pie en un aula, escribiendo en una pizarra. El texto “Introducing Qwen-Image, a foundational image generation model that excels in complex text rendering and precise image editing” aparece en tiza blanca y nítida en el centro de la pizarra. La luz natural suave se filtra a través de las ventanas, proyectando sombras suaves. La escena se representa en un estilo fotográfico realista con detalles finos, poca profundidad de campo y tonos cálidos. La expresión concentrada de la chica y el polvo de tiza en el aire añaden dinamismo. Los elementos de fondo incluyen escritorios y pósters educativos, sutilmente desenfocados para enfatizar la acción central. Resolución ultra detallada de 32K, calidad DSLR, efecto bokeh suave, composición estilo documental.

Una joven con uniforme escolar está de pie en un aula

El texto ‘Qwen-Image on Novita AI’ diseñado en un elegante estilo de vidrio translúcido. Cada letra parece hecha de vidrio esmerilado o brillante, con iluminación realista, sombras suaves y reflejos sutiles. El fondo es minimalista y moderno, posiblemente un degradado suave, desenfoque abstracto o superficie oscura, para realzar el efecto de vidrio. El aspecto general es elegante, futurista y visualmente impactante.

El texto 'Qwen-Image on Novita AI'

Empieza a usar Qwen-Image hoy

¿Listo para experimentar un renderizado superior de texto en imágenes generadas por IA? Comienza con Qwen-Image en nuestra plataforma de inferencia de IA:

  1. Regístrate para obtener tu cuenta de Novita AI
  2. Obtén tu clave de API desde el panel de control
  3. Usa nuestra documentación completa de la API
  4. Empieza a generar imágenes con calidad de texto excepcional

Qwen-Image ya está disponible en Novita AI – trayéndote la próxima generación de generación de texto a imagen con capacidades de renderizado de texto inigualables a través de nuestra plataforma de inferencia de IA.

Novita AI es una plataforma en la nube de IA que ayuda a los desarrolladores a implementar modelos de IA fácilmente a través de una API simple, respaldada por una infraestructura de GPU en la nube asequible y confiable. Al apoyar bibliotecas de código abierto para inferencia y servicio de LLM, Novita AI impulsa el futuro de la innovación en IA.