FLUX.1 Kontext Pro vs Max vs Dev na Novita AI

FLUX.1 Kontext Pro vs Max vs Dev na Novita AI

FLUX.1 Kontext é uma família de modelos de edição de imagem com consciência de contexto da Black Forest Labs, disponível na Novita AI em três níveis: Dev, Pro e Max. Diferente dos modelos texto-para-imagem FLUX.1, o Kontext recebe uma imagem existente mais um prompt de texto e edita a imagem preservando o contexto — alterando a roupa de um sujeito, trocando fundos, ajustando tipografia ou compondo novos elementos sem reconstruir do zero. Este guia aborda as diferenças entre os três níveis, seus parâmetros de API, preços e qual escolher na Novita AI.

O que é FLUX.1 Kontext?

FLUX.1 Kontext é a linha de modelos de edição de imagem da Black Forest Labs, distinta dos modelos texto-para-imagem FLUX.1 e FLUX1.1. A principal capacidade é a edição com consciência de contexto: você fornece uma ou mais imagens de referência junto com uma instrução textual, e o modelo preserva a identidade do sujeito, estilo e relações espaciais no resultado editado.

Tarefas práticas que ele executa bem:

  • Alterar a roupa, cor do cabelo ou acessórios de um personagem mantendo o rosto
  • Trocar ou estender fundos sem afetar o sujeito em primeiro plano
  • Editar texto e tipografia na imagem (placas, rótulos, sobreposições)
  • Compor elementos de múltiplas imagens de origem
  • Transferência de estilo que preserva o conteúdo estrutural

Na Novita AI, todas as três variantes Kontext são servidas através da API assíncrona padrão em https://api.novita.ai. Você faz um POST para o endpoint relevante, recebe um task_id, e então consulta a API de Resultado de Tarefa até que a saída esteja pronta.

FLUX.1 Kontext vs FLUX.1 Texto-para-Imagem

Essa distinção é importante ao escolher a ferramenta certa. FLUX.1 [dev] e [schnell] na Novita AI são modelos texto-para-imagem: geram imagens apenas a partir de prompts de texto, sem entrada de imagem. FLUX.1 Kontext Dev, Pro e Max são modelos de edição de imagem: eles exigem pelo menos uma imagem de origem e produzem edições baseadas nessa entrada.

Se você deseja gerar do zero, use FLUX.1 [dev] ou [schnell]. Se deseja editar, retocar ou transformar uma imagem existente preservando seu contexto, use FLUX.1 Kontext.

Qual Nível Você Deve Usar?

Dev Pro Max
Endpoint Novita AI /v3/async/flux-1-kontext-dev /v3/async/flux-1-kontext-pro /v3/async/flux-1-kontext-max
Preço por imagem $0,0225 ($0,018 rápido) $0,036 $0,072
Controle de tamanho de saída Dimensões em pixels (256–1536 por lado) Predefinições de proporção Predefinições de proporção
Etapas de inferência Configuráveis (1–50, padrão 28) Fixas Fixas
Modo rápido Sim (custo menor, qualidade ligeiramente reduzida) Não Não
Tolerância de segurança Não Sim (1–5, padrão 2) Sim (1–5, padrão 2)
Máx. imagens de origem 4 4 4
Melhor para Pipelines de alto volume, fluxos sensíveis a custo, necessidades de resolução personalizada Qualidade e custo equilibrados, uso em produção Máxima qualidade de saída, consistência premium

Use Dev quando: você precisar de throughput com boa relação custo-benefício, quiser ajustar as etapas de inferência ou dimensões dos pixels de saída, ou estiver executando pipelines automatizados de alto volume onde o modo rápido faz sentido.

Use Pro quando: você quiser edições confiáveis e de nível de produção a um preço médio e não precisar ajustar as etapas de inferência. A interface de proporção é mais simples de trabalhar para formatos web e sociais.

Use Max quando: a qualidade da saída for a principal preocupação e o custo for secundário. O Max visa consistência premium para ativos profissionais, imagens de marca ou trabalhos onde a fidelidade visual afeta diretamente o produto final.

FLUX.1 Kontext Dev na Novita AI

Endpoint: POST https://api.novita.ai/v3/async/flux-1-kontext-dev

Dev oferece o maior controle sobre os parâmetros de geração. Você pode definir dimensões exatas em pixels em vez de predefinições de proporção, ajustar as etapas de inferência e ativar o modo rápido para reduzir custos em detrimento de alguma qualidade.

Parâmetros da requisição:

Parâmetro Tipo Padrão Observações
prompt string obrigatório Instrução de edição
images string[] opcional Base64 ou URL; até 4 imagens
fast_mode boolean false Reduz o custo para $0,018/imagem
size string largura*altura, 256–1536 por dimensão
num_inference_steps integer 28 Faixa 1–50
guidance_scale number 2,5 Faixa 1,0–20,0
num_images integer 1 Faixa 1–4
seed integer -1 -1 = aleatório
output_format string jpeg jpeg, png, webp

Quando ajustar as etapas: para edições simples (mudança de cor, substituição de texto), 20 etapas geralmente são suficientes. Para alterações composicionais complexas ou mesclagem de múltiplas imagens, 28–35 etapas geralmente melhoram a coerência. Acima de 40 etapas raramente adiciona qualidade significativa em tarefas de edição.

FLUX.1 Kontext Pro na Novita AI

Endpoint: POST https://api.novita.ai/v3/async/flux-1-kontext-pro

Pro troca o controle granular de etapas por uma interface mais simples e um degrau acima na qualidade da saída. Você especifica a proporção em vez de dimensões em pixels, facilitando a segmentação de formatos padrão (1:1 para redes sociais, 16:9 para thumbnails de vídeo, 9:16 para mobile).

Parâmetros da requisição:

Parâmetro Tipo Padrão Observações
prompt string obrigatório Instrução de edição
images string[] opcional Base64 ou URL; até 4 imagens
guidance_scale number 3,5 Faixa 1,0–20,0
aspect_ratio string 1:1, 16:9, 4:3, 3:2, 2:3, 3:4, 9:16, 9:21, 21:9
seed integer -1 -1 = aleatório
safety_tolerance string 2 1 (estrito) a 5 (permissivo); apenas no modo texto-para-imagem

Nota: a documentação da Novita AI indica que safety_tolerance é aplicado apenas no modo texto-para-imagem para Pro. Ao usar Kontext para edição de imagem (ou seja, passando imagens de origem), este parâmetro não tem efeito.

FLUX.1 Kontext Max na Novita AI

Endpoint: POST https://api.novita.ai/v3/async/flux-1-kontext-max

Max compartilha a interface do Pro quase exatamente — mesmas predefinições de proporção, mesmos controles de tolerância de segurança — mas visa maior consistência e fidelidade. Se você está usando Pro e as saídas são inconsistentes em um lote, ou se uma edição específica continua divergindo do sujeito original, Max é o próximo passo a tentar.

Parâmetros da requisição:

Parâmetro Tipo Padrão Observações
prompt string obrigatório Instrução de edição
images string[] opcional Base64 ou URL; até 4 imagens
seed integer Faixa -1–2147483647
guidance_scale number 3,5 Faixa 1,0–20,0
safety_tolerance string 2 1 (estrito) a 5 (permissivo)
aspect_ratio string Mesmas predefinições do Pro

A principal diferença prática do Pro é o teto de qualidade de saída e o preço. Para a maioria dos fluxos de trabalho de API, o Pro atende ao caso de uso. O Max faz sentido para produção de ativos finais onde você precisa da melhor saída do modelo antes da revisão humana.

Quanto Custa o FLUX.1 Kontext na Novita AI?

Preços em 26/06/2026 (fonte: página de preços da Novita AI):

Variante Preço por imagem
FLUX.1 Kontext Dev $0,0225
FLUX.1 Kontext Dev (modo rápido) $0,018
FLUX.1 Kontext Pro $0,036
FLUX.1 Kontext Max $0,072

Os preços da Novita AI são mais baixos que as taxas diretas da API BFL (Pro: $0,04, Max: $0,08 na BFL em 26/06/2026). Para pipelines de edição de alto volume, a diferença se acumula rapidamente: 10.000 edições Pro na Novita custam $360 contra $400 direto.

Início Rápido da API

Obtenha sua chave de API no console da Novita AI. Todos os três endpoints Kontext usam o mesmo padrão assíncrono: POST para enviar, receber um task_id, depois GET do endpoint de resultado da tarefa até que a saída esteja pronta.

Exemplo em Python — FLUX.1 Kontext Pro:

import requests
import time

API_KEY = "SUA_CHAVE_API_NOVITA"
BASE_URL = "https://api.novita.ai"

def edit_image_kontext_pro(image_url: str, prompt: str, aspect_ratio: str = "1:1") -> str:
    response = requests.post(
        f"{BASE_URL}/v3/async/flux-1-kontext-pro",
        headers={
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json",
        },
        json={
            "prompt": prompt,
            "images": [image_url],
            "aspect_ratio": aspect_ratio,
            "guidance_scale": 3.5,
        },
    )
    response.raise_for_status()
    task_id = response.json()["task_id"]

    # Poll para resultado
    while True:
        result = requests.get(
            f"{BASE_URL}/v3/async/task-result",
            headers={"Authorization": f"Bearer {API_KEY}"},
            params={"task_id": task_id},
        )
        result.raise_for_status()
        data = result.json()
        if data.get("task", {}).get("status") == "TASK_STATUS_SUCCEED":
            return data["images"][0]["image_url"]
        elif data.get("task", {}).get("status") == "TASK_STATUS_FAILED":
            raise RuntimeError(f"Tarefa falhou: {data}")
        time.sleep(2)

Variante Dev com modo rápido e resolução personalizada:

response = requests.post(
    f"{BASE_URL}/v3/async/flux-1-kontext-dev",
    headers={
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json",
    },
    json={
        "prompt": "Mude a jaqueta para couro vermelho",
        "images": [image_url],
        "fast_mode": True,
        "size": "1024*1024",
        "num_inference_steps": 28,
        "guidance_scale": 2.5,
        "output_format": "webp",
    },
)

Variante Max para máxima qualidade:

response = requests.post(
    f"{BASE_URL}/v3/async/flux-1-kontext-max",
    headers={
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json",
    },
    json={
        "prompt": "Substitua o fundo por um pôr do sol sobre montanhas",
        "images": [image_url],
        "aspect_ratio": "16:9",
        "guidance_scale": 3.5,
    },
)

Padrões Práticos de Edição

Consistência do sujeito entre quadros: Para manter a identidade de um personagem ou produto consistente em um lote, passe a mesma imagem de origem com um prompt variado para cada quadro. Uma seed fixa bloqueia o estilo de saída dentro de uma sessão.

Composição de múltiplas imagens: Todas as três variantes aceitam até 4 imagens de origem. Passe uma referência de personagem e uma referência de fundo juntas e instrua o modelo a compô-las. Instruções mais simples produzem resultados mais previsíveis.

Edições de tipografia: O Kontext lida com texto em imagem melhor que a maioria dos modelos de edição. Especifique a mudança explicitamente no prompt: "Mude o texto da placa de 'ABERTO' para 'FECHADO'". Pro e Max produzem edições de tipografia mais legíveis que o Dev, particularmente para texto pequeno ou estilizado.

Refinamento iterativo: A saída do Kontext é apenas uma imagem — alimente-a de volta como fonte para a próxima edição. Primeiro uma edição grosseira com Dev modo rápido, depois uma passagem de qualidade final com Pro ou Max.

Quando evitar Kontext: Para gerar imagens sem referência de origem, use FLUX.1 Dev texto-para-imagem na Novita AI — Kontext precisa de imagens de origem para editar.

Conclusão

FLUX.1 Kontext é uma família de modelos de edição de imagem com consciência de contexto — não um sistema texto-para-imagem. Sua capacidade central é preservar a identidade do sujeito, relações espaciais e estilo enquanto aplica edições precisas orientadas por texto a uma imagem existente. Essa distinção importa ao escolhê-lo em vez de FLUX.1 Dev, Schnell ou outros modelos T2I: Kontext é a ferramenta certa quando você tem imagens de origem e precisa alterar algo específico nelas.

Entre os três níveis na Novita AI, a lógica de seleção é direta. Dev é a escolha certa para fluxos de alto rendimento ou sensíveis a custo — ele expõe controle de etapas de inferência e dimensionamento em nível de pixel, e o modo rápido reduz o preço para $0,018/imagem. Pro é o padrão para a maioria dos casos de uso em produção: interface de proporção mais simples, melhor consistência de saída que Dev e um preço intermediário ($0,036/imagem) que funciona para pipelines contínuos. Max visa a produção de ativos finais onde o teto de qualidade importa mais que o custo — ele compartilha a interface do Pro, mas oferece maior consistência, sendo a escolha certa para imagens de marca, trabalhos prontos para impressão ou qualquer saída que vá diretamente para o público sem edição adicional.

Todas as três variantes aceitam até 4 imagens de origem e retornam resultados através da mesma API de tarefa assíncrona, então a seleção de nível é, na prática, uma mudança de endpoint de uma linha. O nível certo depende de onde a saída será usada: pipelines automatizados tendem ao Dev, APIs de produção tendem ao Pro, entrega final tende ao Max.

FAQ

P: Qual é a maior diferença prática entre Dev, Pro e Max?

R: Dev oferece controle direto sobre as etapas de inferência e dimensões dos pixels de saída, além de uma opção de modo rápido que reduz o custo em detrimento de alguma qualidade. Pro e Max usam predefinições de proporção e fixam o pipeline de inferência — Pro é a opção de produção equilibrada, Max é o teto de qualidade mais alto. Os preços refletem isso: Dev a partir de $0,018, Pro $0,036, Max $0,072 por imagem na Novita AI (verificado em 26/06/2026).

P: Com qual nível devo começar?

R: Comece com Pro. Ele cobre a maioria dos casos de uso de edição de imagem em produção com uma interface simples e saída confiável. Mude para Dev se precisar de controle de custo de throughput ou dimensões de pixels personalizadas; vá para Max se as saídas do Pro forem inconsistentes ou se estiver produzindo ativos finais que vão diretamente para o público.

P: Quando vale a pena atualizar de Pro para Max?

R: Quando a consistência da saída importa mais que o custo. Sinais comuns: resultados do Pro divergem em um lote quando a preservação da identidade é crítica (mesmo personagem ou produto em várias edições), edições de tipografia fina estão degradando, ou a saída vai diretamente para produção sem uma etapa de controle de qualidade humano. Max não expõe parâmetros diferentes — é a mesma interface do Pro, apenas um teto de qualidade mais alto.

P: O modo rápido do Dev reduz a qualidade de forma perceptível?

R: Para edições simples — mudanças de cor sólida, troca de fundo, remoção de objeto — a qualidade do modo rápido geralmente é aceitável. Para composição complexa, mudanças precisas de tipografia ou edições que exigem forte consistência do sujeito, o Dev padrão ou Pro produz resultados mais confiáveis. O modo rápido é melhor tratado como um nível de triagem ou prototipagem, não um nível de saída final.

P: Qual é a diferença entre FLUX.1 Kontext e os modelos texto-para-imagem FLUX.1?

R: FLUX.1 Kontext (Dev/Pro/Max) é um modelo de edição de imagem: ele recebe uma ou mais imagens de origem mais uma instrução textual e retorna uma versão editada. FLUX.1 [dev] e [schnell] são modelos texto-para-imagem: geram imagens a partir de um prompt de texto sem necessidade de entrada de imagem. As duas famílias resolvem problemas diferentes e não são intercambiáveis — use Kontext quando tiver imagens de origem para editar, e modelos T2I quando gerar do zero.

Artigos recomendados