FLUX.1 Kontext Pro vs Max vs Dev en Novita AI

FLUX.1 Kontext Pro vs Max vs Dev en Novita AI

FLUX.1 Kontext es una familia de modelos de edición de imágenes con conciencia de contexto de Black Forest Labs, disponible en Novita AI en tres niveles: Dev, Pro y Max. A diferencia de los modelos de texto a imagen FLUX.1, Kontext toma una imagen existente junto con un prompt de texto y edita la imagen preservando el contexto: cambiar la vestimenta de un sujeto, intercambiar fondos, ajustar tipografía o componer nuevos elementos sin reconstruir desde cero. Esta guía cubre las diferencias entre los tres niveles, sus parámetros de API, precios y cuál elegir en Novita AI.

¿Qué es FLUX.1 Kontext?

FLUX.1 Kontext es la línea de modelos de edición de imágenes de Black Forest Labs, distinta de sus modelos de texto a imagen FLUX.1 y FLUX1.1. La capacidad clave es la edición con conciencia de contexto: proporcionas una o más imágenes de referencia junto con una instrucción de texto, y el modelo mantiene la identidad del sujeto, el estilo y las relaciones espaciales en el resultado editado.

Tareas prácticas que maneja bien:

  • Cambiar la ropa, el color de pelo o los accesorios de un personaje manteniendo su rostro
  • Intercambiar o extender fondos sin afectar al sujeto en primer plano
  • Editar texto y tipografía dentro de la imagen (carteles, etiquetas, superposiciones)
  • Componer elementos de múltiples imágenes de origen
  • Transferencia de estilo que preserva el contenido estructural

En Novita AI, las tres variantes de Kontext se sirven a través de la API de tareas asíncrona estándar en https://api.novita.ai. Haces un POST al endpoint correspondiente, obtienes un task_id, luego consultas la API de resultado de tarea hasta que la salida esté lista.

FLUX.1 Kontext vs FLUX.1 Texto a Imagen

Esta distinción es importante al elegir la herramienta adecuada. FLUX.1 [dev] y [schnell] en Novita AI son modelos de texto a imagen: generan imágenes solo a partir de prompts de texto, sin entrada de imagen. FLUX.1 Kontext Dev, Pro y Max son modelos de edición de imágenes: requieren al menos una imagen de origen y producen ediciones basadas en esa entrada.

Si quieres generar desde cero, usa FLUX.1 [dev] o [schnell]. Si quieres editar, retocar o transformar una imagen existente mientras preservas su contexto, usa FLUX.1 Kontext.

¿Qué nivel deberías usar?

Dev Pro Max
Endpoint de Novita AI /v3/async/flux-1-kontext-dev /v3/async/flux-1-kontext-pro /v3/async/flux-1-kontext-max
Precio por imagen $0.0225 ($0.018 modo rápido) $0.036 $0.072
Control de tamaño de salida Dimensiones en píxeles (256–1536 por lado) Preajustes de relación de aspecto Preajustes de relación de aspecto
Pasos de inferencia Configurable (1–50, predeterminado 28) Fijo Fijo
Modo rápido Sí (menor costo, calidad ligeramente reducida) No No
Tolerancia de seguridad No Sí (1–5, predeterminado 2) Sí (1–5, predeterminado 2)
Máx. imágenes de origen 4 4 4
Ideal para Pipelines de alto volumen, flujos sensibles al costo, necesidades de resolución personalizada Calidad y costo equilibrados, uso en producción Máxima calidad de salida, consistencia premium

Usa Dev cuando: necesites rendimiento rentable, quieras ajustar los pasos de inferencia o las dimensiones de píxeles de salida, o estés ejecutando pipelines automatizados de alto volumen donde el modo rápido tenga sentido.

Usa Pro cuando: quieras ediciones fiables de calidad de producción a un precio medio y no necesites ajustar los pasos de inferencia. La interfaz de relación de aspecto es más sencilla de usar para formatos web y redes sociales.

Usa Max cuando: la calidad de salida sea la principal preocupación y el costo sea secundario. Max apunta a una consistencia premium para activos profesionales, imágenes de marca o trabajos donde la fidelidad visual afecta directamente el producto final.

FLUX.1 Kontext Dev en Novita AI

Endpoint: POST https://api.novita.ai/v3/async/flux-1-kontext-dev

Dev ofrece el mayor control sobre los parámetros de generación. Puedes establecer dimensiones de píxeles exactas en lugar de preajustes de relación de aspecto, ajustar los pasos de inferencia y activar el modo rápido para reducir el costo a costa de algo de calidad.

Parámetros de solicitud:

Parámetro Tipo Predeterminado Notas
prompt string requerido Instrucción de edición
images string[] opcional Base64 o URL; hasta 4 imágenes
fast_mode boolean false Reduce el costo a $0.018/imagen
size string ancho*alto, 256–1536 por dimensión
num_inference_steps integer 28 Rango 1–50
guidance_scale number 2.5 Rango 1.0–20.0
num_images integer 1 Rango 1–4
seed integer -1 -1 = aleatorio
output_format string jpeg jpeg, png, webp

Cuándo ajustar los pasos: para ediciones simples (cambio de color, reemplazo de texto), 20 pasos suele ser suficiente. Para cambios compositivos complejos o combinación de múltiples imágenes, 28–35 pasos generalmente mejora la coherencia. Superar los 40 pasos rara vez añade calidad significativa en tareas de edición.

FLUX.1 Kontext Pro en Novita AI

Endpoint: POST https://api.novita.ai/v3/async/flux-1-kontext-pro

Pro intercambia el control granular de pasos por una interfaz más simple y un salto en la calidad de salida. Especificas la relación de aspecto en lugar de las dimensiones de píxeles, lo que facilita apuntar a formatos estándar (1:1 para redes sociales, 16:9 para miniaturas de video, 9:16 para móvil).

Parámetros de solicitud:

Parámetro Tipo Predeterminado Notas
prompt string requerido Instrucción de edición
images string[] opcional Base64 o URL; hasta 4 imágenes
guidance_scale number 3.5 Rango 1.0–20.0
aspect_ratio string 1:1, 16:9, 4:3, 3:2, 2:3, 3:4, 9:16, 9:21, 21:9
seed integer -1 -1 = aleatorio
safety_tolerance string 2 1 (estricto) a 5 (permisivo); solo modo texto a imagen

Nota: los documentos de Novita AI indican que safety_tolerance solo se aplica en modo texto a imagen para Pro. Al usar Kontext para edición de imágenes (es decir, pasando imágenes de origen), este parámetro no tiene efecto.

FLUX.1 Kontext Max en Novita AI

Endpoint: POST https://api.novita.ai/v3/async/flux-1-kontext-max

Max comparte casi exactamente la interfaz de Pro — mismos preajustes de relación de aspecto, mismos controles de tolerancia de seguridad — pero apunta a una mayor consistencia y fidelidad. Si estás usando Pro y las salidas son inconsistentes en un lote, o si una edición específica sigue desviándose del sujeto de origen, Max es el siguiente paso a probar.

Parámetros de solicitud:

Parámetro Tipo Predeterminado Notas
prompt string requerido Instrucción de edición
images string[] opcional Base64 o URL; hasta 4 imágenes
seed integer Rango -1–2147483647
guidance_scale number 3.5 Rango 1.0–20.0
safety_tolerance string 2 1 (estricto) a 5 (permisivo)
aspect_ratio string Mismos preajustes que Pro

La principal diferencia práctica con Pro es el techo de calidad de salida y el precio. Para la mayoría de los flujos de trabajo de API, Pro cubre el caso de uso. Max tiene sentido para la producción de activos finales donde necesitas la mejor salida del modelo antes de la revisión humana.

¿Cuánto cuesta FLUX.1 Kontext en Novita AI?

Precios a fecha de 2026-06-26 (fuente: página de precios de Novita AI):

Variante Precio por imagen
FLUX.1 Kontext Dev $0.0225
FLUX.1 Kontext Dev (modo rápido) $0.018
FLUX.1 Kontext Pro $0.036
FLUX.1 Kontext Max $0.072

Los precios de Novita AI son más bajos que las tarifas directas de la API de BFL (Pro: $0.04, Max: $0.08 en BFL a fecha de 2026-06-26). Para pipelines de edición de alto volumen, la diferencia se acumula rápidamente: 10,000 ediciones Pro en Novita cuestan $360 frente a $400 directo.

Inicio rápido de la API

Obtén tu clave de API desde la consola de Novita AI. Los tres endpoints de Kontext usan el mismo patrón asíncrono: POST para enviar, recibir un task_id, luego GET desde el endpoint de resultado de tarea hasta que la salida esté lista.

Ejemplo en Python — FLUX.1 Kontext Pro:

import requests
import time

API_KEY = "TU_CLAVE_API_NOVITA"
BASE_URL = "https://api.novita.ai"

def edit_image_kontext_pro(image_url: str, prompt: str, aspect_ratio: str = "1:1") -> str:
    response = requests.post(
        f"{BASE_URL}/v3/async/flux-1-kontext-pro",
        headers={
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json",
        },
        json={
            "prompt": prompt,
            "images": [image_url],
            "aspect_ratio": aspect_ratio,
            "guidance_scale": 3.5,
        },
    )
    response.raise_for_status()
    task_id = response.json()["task_id"]

    # Consultar hasta obtener resultado
    while True:
        result = requests.get(
            f"{BASE_URL}/v3/async/task-result",
            headers={"Authorization": f"Bearer {API_KEY}"},
            params={"task_id": task_id},
        )
        result.raise_for_status()
        data = result.json()
        if data.get("task", {}).get("status") == "TASK_STATUS_SUCCEED":
            return data["images"][0]["image_url"]
        elif data.get("task", {}).get("status") == "TASK_STATUS_FAILED":
            raise RuntimeError(f"Tarea fallida: {data}")
        time.sleep(2)

Variante Dev con modo rápido y resolución personalizada:

response = requests.post(
    f"{BASE_URL}/v3/async/flux-1-kontext-dev",
    headers={
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json",
    },
    json={
        "prompt": "Cambia la chaqueta a cuero rojo",
        "images": [image_url],
        "fast_mode": True,
        "size": "1024*1024",
        "num_inference_steps": 28,
        "guidance_scale": 2.5,
        "output_format": "webp",
    },
)

Variante Max para máxima calidad:

response = requests.post(
    f"{BASE_URL}/v3/async/flux-1-kontext-max",
    headers={
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json",
    },
    json={
        "prompt": "Reemplaza el fondo con un atardecer sobre montañas",
        "images": [image_url],
        "aspect_ratio": "16:9",
        "guidance_scale": 3.5,
    },
)

Patrones de edición prácticos

Consistencia del sujeto entre fotogramas: Para mantener la identidad de un personaje o producto consistente en un lote, pasa la misma imagen de origen con un prompt variado para cada fotograma. Un seed fijo bloquea el estilo de salida dentro de una sesión.

Composición de múltiples imágenes: Las tres variantes aceptan hasta 4 imágenes de origen. Pasa una referencia de personaje y una referencia de fondo juntas e instruye al modelo para que las componga. Las instrucciones más simples producen resultados más predecibles.

Ediciones de tipografía: Kontext maneja el texto dentro de la imagen mejor que la mayoría de los modelos de edición. Especifica el cambio explícitamente en el prompt: "Cambia el texto del cartel de 'ABIERTO' a 'CERRADO'". Pro y Max producen ediciones de tipografía más legibles que Dev, particularmente para texto pequeño o estilizado.

Refinamiento iterativo: La salida de Kontext es solo una imagen — reintrodúcela como origen para la siguiente edición. Primero una edición aproximada con Dev modo rápido, luego un pase de calidad final con Pro o Max.

Cuándo evitar Kontext: Para generar imágenes sin referencia de origen, usa FLUX.1 Dev texto a imagen en Novita AI — Kontext necesita imágenes de origen para editar.

Conclusión

FLUX.1 Kontext es una familia de modelos de edición de imágenes con conciencia de contexto — no es un sistema de texto a imagen. Su capacidad principal es preservar la identidad del sujeto, las relaciones espaciales y el estilo mientras aplica ediciones precisas impulsadas por texto a una imagen existente. Esta distinción importa al elegirlo frente a FLUX.1 Dev, Schnell u otros modelos T2I: Kontext es la herramienta adecuada cuando tienes imágenes de origen y necesitas cambiar algo específico de ellas.

En los tres niveles de Novita AI, la lógica de selección es sencilla. Dev es la opción correcta para flujos de trabajo de alto rendimiento o sensibles al costo — expone control de pasos de inferencia y tamaño a nivel de píxel, y el modo rápido reduce el precio a $0.018/imagen. Pro es el predeterminado para la mayoría de los casos de uso de producción: interfaz de relación de aspecto más simple, mejor consistencia de salida que Dev y un precio intermedio ($0.036/imagen) que funciona para pipelines continuos. Max está destinado a la producción de activos finales donde el techo de calidad importa más que el costo — comparte la interfaz de Pro pero ofrece mayor consistencia, siendo la opción correcta para imágenes de marca, trabajos listos para impresión o cualquier salida que vaya directamente frente a una audiencia sin edición adicional.

Las tres variantes aceptan hasta 4 imágenes de origen y devuelven resultados a través de la misma API de tareas asíncrona, por lo que la selección de nivel es un cambio de endpoint de una línea en la práctica. El nivel adecuado depende de dónde termine la salida: pipelines automatizados optan por Dev, APIs de producción optan por Pro, entrega final opta por Max.

Preguntas frecuentes

P: ¿Cuál es la mayor diferencia práctica entre Dev, Pro y Max?

R: Dev te da control directo sobre los pasos de inferencia y las dimensiones de píxeles de salida, además de una opción de modo rápido que reduce el costo a costa de algo de calidad. Pro y Max usan preajustes de relación de aspecto en su lugar y fijan el pipeline de inferencia — Pro es la opción equilibrada de producción, Max es el techo de mayor calidad. El precio lo refleja: Dev desde $0.018, Pro $0.036, Max $0.072 por imagen en Novita AI (verificado 2026-06-26).

P: ¿Con qué nivel debería empezar?

R: Empieza con Pro. Cubre la mayoría de los casos de uso de edición de imágenes en producción con una interfaz simple y salida fiable. Cambia a Dev si necesitas control de costo de rendimiento o dimensiones de píxeles personalizadas; muévete a Max si las salidas de Pro son inconsistentes o si estás produciendo activos finales que van directamente a una audiencia.

P: ¿Cuándo vale la pena actualizar de Pro a Max?

R: Cuando la consistencia de salida importa más que el costo. Señales comunes: los resultados de Pro varían en un lote cuando la preservación de identidad es crítica (mismo personaje o producto en muchas ediciones), las ediciones de tipografía fina se degradan, o la salida va directamente a producción sin un paso de control de calidad humano. Max no expone parámetros diferentes — es la misma interfaz que Pro, solo que con un techo de calidad más alto.

P: ¿El modo rápido de Dev reduce notablemente la calidad?

R: Para ediciones simples — cambios de color sólido, intercambios de fondo, eliminación de objetos — la calidad del modo rápido suele ser aceptable. Para composiciones complejas, cambios de tipografía precisos o ediciones que requieren una fuerte consistencia del sujeto, el Dev estándar o Pro produce resultados más fiables. El modo rápido es mejor tratarlo como un nivel de prueba o prototipo, no como un nivel de salida final.

P: ¿Cuál es la diferencia entre FLUX.1 Kontext y los modelos de texto a imagen FLUX.1?

R: FLUX.1 Kontext (Dev/Pro/Max) es un modelo de edición de imágenes: toma una o más imágenes de origen más una instrucción de texto y devuelve una versión editada. FLUX.1 [dev] y [schnell] son modelos de texto a imagen: generan imágenes a partir de un prompt de texto sin requerir entrada de imagen. Las dos familias resuelven problemas diferentes y no son intercambiables — usa Kontext cuando tengas imágenes de origen para editar, y modelos T2I cuando generes desde cero.

Artículos recomendados