- O que é FLUX.1 Kontext?
- FLUX.1 Kontext vs FLUX.1 Texto-para-Imagem
- Qual Nível Você Deve Usar?
- FLUX.1 Kontext Dev na Novita AI
- FLUX.1 Kontext Pro na Novita AI
- FLUX.1 Kontext Max na Novita AI
- Quanto Custa o FLUX.1 Kontext na Novita AI?
- Início Rápido da API
- Padrões Práticos de Edição
- Conclusão
- FAQ
- Artigos recomendados
FLUX.1 Kontext é uma família de modelos de edição de imagem com consciência de contexto da Black Forest Labs, disponível na Novita AI em três níveis: Dev, Pro e Max. Diferente dos modelos texto-para-imagem FLUX.1, o Kontext recebe uma imagem existente mais um prompt de texto e edita a imagem preservando o contexto — alterando a roupa de um sujeito, trocando fundos, ajustando tipografia ou compondo novos elementos sem reconstruir do zero. Este guia aborda as diferenças entre os três níveis, seus parâmetros de API, preços e qual escolher na Novita AI.
O que é FLUX.1 Kontext?
FLUX.1 Kontext é a linha de modelos de edição de imagem da Black Forest Labs, distinta dos modelos texto-para-imagem FLUX.1 e FLUX1.1. A principal capacidade é a edição com consciência de contexto: você fornece uma ou mais imagens de referência junto com uma instrução textual, e o modelo preserva a identidade do sujeito, estilo e relações espaciais no resultado editado.
Tarefas práticas que ele executa bem:
- Alterar a roupa, cor do cabelo ou acessórios de um personagem mantendo o rosto
- Trocar ou estender fundos sem afetar o sujeito em primeiro plano
- Editar texto e tipografia na imagem (placas, rótulos, sobreposições)
- Compor elementos de múltiplas imagens de origem
- Transferência de estilo que preserva o conteúdo estrutural
Na Novita AI, todas as três variantes Kontext são servidas através da API assíncrona padrão em https://api.novita.ai. Você faz um POST para o endpoint relevante, recebe um task_id, e então consulta a API de Resultado de Tarefa até que a saída esteja pronta.
FLUX.1 Kontext vs FLUX.1 Texto-para-Imagem
Essa distinção é importante ao escolher a ferramenta certa. FLUX.1 [dev] e [schnell] na Novita AI são modelos texto-para-imagem: geram imagens apenas a partir de prompts de texto, sem entrada de imagem. FLUX.1 Kontext Dev, Pro e Max são modelos de edição de imagem: eles exigem pelo menos uma imagem de origem e produzem edições baseadas nessa entrada.
Se você deseja gerar do zero, use FLUX.1 [dev] ou [schnell]. Se deseja editar, retocar ou transformar uma imagem existente preservando seu contexto, use FLUX.1 Kontext.
Qual Nível Você Deve Usar?
| Dev | Pro | Max | |
|---|---|---|---|
| Endpoint Novita AI | /v3/async/flux-1-kontext-dev |
/v3/async/flux-1-kontext-pro |
/v3/async/flux-1-kontext-max |
| Preço por imagem | $0,0225 ($0,018 rápido) | $0,036 | $0,072 |
| Controle de tamanho de saída | Dimensões em pixels (256–1536 por lado) | Predefinições de proporção | Predefinições de proporção |
| Etapas de inferência | Configuráveis (1–50, padrão 28) | Fixas | Fixas |
| Modo rápido | Sim (custo menor, qualidade ligeiramente reduzida) | Não | Não |
| Tolerância de segurança | Não | Sim (1–5, padrão 2) | Sim (1–5, padrão 2) |
| Máx. imagens de origem | 4 | 4 | 4 |
| Melhor para | Pipelines de alto volume, fluxos sensíveis a custo, necessidades de resolução personalizada | Qualidade e custo equilibrados, uso em produção | Máxima qualidade de saída, consistência premium |
Use Dev quando: você precisar de throughput com boa relação custo-benefício, quiser ajustar as etapas de inferência ou dimensões dos pixels de saída, ou estiver executando pipelines automatizados de alto volume onde o modo rápido faz sentido.
Use Pro quando: você quiser edições confiáveis e de nível de produção a um preço médio e não precisar ajustar as etapas de inferência. A interface de proporção é mais simples de trabalhar para formatos web e sociais.
Use Max quando: a qualidade da saída for a principal preocupação e o custo for secundário. O Max visa consistência premium para ativos profissionais, imagens de marca ou trabalhos onde a fidelidade visual afeta diretamente o produto final.
FLUX.1 Kontext Dev na Novita AI
Endpoint: POST https://api.novita.ai/v3/async/flux-1-kontext-dev
Dev oferece o maior controle sobre os parâmetros de geração. Você pode definir dimensões exatas em pixels em vez de predefinições de proporção, ajustar as etapas de inferência e ativar o modo rápido para reduzir custos em detrimento de alguma qualidade.
Parâmetros da requisição:
| Parâmetro | Tipo | Padrão | Observações |
|---|---|---|---|
prompt |
string | obrigatório | Instrução de edição |
images |
string[] | opcional | Base64 ou URL; até 4 imagens |
fast_mode |
boolean | false | Reduz o custo para $0,018/imagem |
size |
string | — | largura*altura, 256–1536 por dimensão |
num_inference_steps |
integer | 28 | Faixa 1–50 |
guidance_scale |
number | 2,5 | Faixa 1,0–20,0 |
num_images |
integer | 1 | Faixa 1–4 |
seed |
integer | -1 | -1 = aleatório |
output_format |
string | jpeg | jpeg, png, webp |
Quando ajustar as etapas: para edições simples (mudança de cor, substituição de texto), 20 etapas geralmente são suficientes. Para alterações composicionais complexas ou mesclagem de múltiplas imagens, 28–35 etapas geralmente melhoram a coerência. Acima de 40 etapas raramente adiciona qualidade significativa em tarefas de edição.
FLUX.1 Kontext Pro na Novita AI
Endpoint: POST https://api.novita.ai/v3/async/flux-1-kontext-pro
Pro troca o controle granular de etapas por uma interface mais simples e um degrau acima na qualidade da saída. Você especifica a proporção em vez de dimensões em pixels, facilitando a segmentação de formatos padrão (1:1 para redes sociais, 16:9 para thumbnails de vídeo, 9:16 para mobile).
Parâmetros da requisição:
| Parâmetro | Tipo | Padrão | Observações |
|---|---|---|---|
prompt |
string | obrigatório | Instrução de edição |
images |
string[] | opcional | Base64 ou URL; até 4 imagens |
guidance_scale |
number | 3,5 | Faixa 1,0–20,0 |
aspect_ratio |
string | — | 1:1, 16:9, 4:3, 3:2, 2:3, 3:4, 9:16, 9:21, 21:9 |
seed |
integer | -1 | -1 = aleatório |
safety_tolerance |
string | 2 | 1 (estrito) a 5 (permissivo); apenas no modo texto-para-imagem |
Nota: a documentação da Novita AI indica que safety_tolerance é aplicado apenas no modo texto-para-imagem para Pro. Ao usar Kontext para edição de imagem (ou seja, passando imagens de origem), este parâmetro não tem efeito.
FLUX.1 Kontext Max na Novita AI
Endpoint: POST https://api.novita.ai/v3/async/flux-1-kontext-max
Max compartilha a interface do Pro quase exatamente — mesmas predefinições de proporção, mesmos controles de tolerância de segurança — mas visa maior consistência e fidelidade. Se você está usando Pro e as saídas são inconsistentes em um lote, ou se uma edição específica continua divergindo do sujeito original, Max é o próximo passo a tentar.
Parâmetros da requisição:
| Parâmetro | Tipo | Padrão | Observações |
|---|---|---|---|
prompt |
string | obrigatório | Instrução de edição |
images |
string[] | opcional | Base64 ou URL; até 4 imagens |
seed |
integer | — | Faixa -1–2147483647 |
guidance_scale |
number | 3,5 | Faixa 1,0–20,0 |
safety_tolerance |
string | 2 | 1 (estrito) a 5 (permissivo) |
aspect_ratio |
string | — | Mesmas predefinições do Pro |
A principal diferença prática do Pro é o teto de qualidade de saída e o preço. Para a maioria dos fluxos de trabalho de API, o Pro atende ao caso de uso. O Max faz sentido para produção de ativos finais onde você precisa da melhor saída do modelo antes da revisão humana.
Quanto Custa o FLUX.1 Kontext na Novita AI?
Preços em 26/06/2026 (fonte: página de preços da Novita AI):
| Variante | Preço por imagem |
|---|---|
| FLUX.1 Kontext Dev | $0,0225 |
| FLUX.1 Kontext Dev (modo rápido) | $0,018 |
| FLUX.1 Kontext Pro | $0,036 |
| FLUX.1 Kontext Max | $0,072 |
Os preços da Novita AI são mais baixos que as taxas diretas da API BFL (Pro: $0,04, Max: $0,08 na BFL em 26/06/2026). Para pipelines de edição de alto volume, a diferença se acumula rapidamente: 10.000 edições Pro na Novita custam $360 contra $400 direto.
Início Rápido da API
Obtenha sua chave de API no console da Novita AI. Todos os três endpoints Kontext usam o mesmo padrão assíncrono: POST para enviar, receber um task_id, depois GET do endpoint de resultado da tarefa até que a saída esteja pronta.
Exemplo em Python — FLUX.1 Kontext Pro:
import requests
import time
API_KEY = "SUA_CHAVE_API_NOVITA"
BASE_URL = "https://api.novita.ai"
def edit_image_kontext_pro(image_url: str, prompt: str, aspect_ratio: str = "1:1") -> str:
response = requests.post(
f"{BASE_URL}/v3/async/flux-1-kontext-pro",
headers={
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json",
},
json={
"prompt": prompt,
"images": [image_url],
"aspect_ratio": aspect_ratio,
"guidance_scale": 3.5,
},
)
response.raise_for_status()
task_id = response.json()["task_id"]
# Poll para resultado
while True:
result = requests.get(
f"{BASE_URL}/v3/async/task-result",
headers={"Authorization": f"Bearer {API_KEY}"},
params={"task_id": task_id},
)
result.raise_for_status()
data = result.json()
if data.get("task", {}).get("status") == "TASK_STATUS_SUCCEED":
return data["images"][0]["image_url"]
elif data.get("task", {}).get("status") == "TASK_STATUS_FAILED":
raise RuntimeError(f"Tarefa falhou: {data}")
time.sleep(2)
Variante Dev com modo rápido e resolução personalizada:
response = requests.post(
f"{BASE_URL}/v3/async/flux-1-kontext-dev",
headers={
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json",
},
json={
"prompt": "Mude a jaqueta para couro vermelho",
"images": [image_url],
"fast_mode": True,
"size": "1024*1024",
"num_inference_steps": 28,
"guidance_scale": 2.5,
"output_format": "webp",
},
)
Variante Max para máxima qualidade:
response = requests.post(
f"{BASE_URL}/v3/async/flux-1-kontext-max",
headers={
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json",
},
json={
"prompt": "Substitua o fundo por um pôr do sol sobre montanhas",
"images": [image_url],
"aspect_ratio": "16:9",
"guidance_scale": 3.5,
},
)
Padrões Práticos de Edição
Consistência do sujeito entre quadros: Para manter a identidade de um personagem ou produto consistente em um lote, passe a mesma imagem de origem com um prompt variado para cada quadro. Uma seed fixa bloqueia o estilo de saída dentro de uma sessão.
Composição de múltiplas imagens: Todas as três variantes aceitam até 4 imagens de origem. Passe uma referência de personagem e uma referência de fundo juntas e instrua o modelo a compô-las. Instruções mais simples produzem resultados mais previsíveis.
Edições de tipografia: O Kontext lida com texto em imagem melhor que a maioria dos modelos de edição. Especifique a mudança explicitamente no prompt: "Mude o texto da placa de 'ABERTO' para 'FECHADO'". Pro e Max produzem edições de tipografia mais legíveis que o Dev, particularmente para texto pequeno ou estilizado.
Refinamento iterativo: A saída do Kontext é apenas uma imagem — alimente-a de volta como fonte para a próxima edição. Primeiro uma edição grosseira com Dev modo rápido, depois uma passagem de qualidade final com Pro ou Max.
Quando evitar Kontext: Para gerar imagens sem referência de origem, use FLUX.1 Dev texto-para-imagem na Novita AI — Kontext precisa de imagens de origem para editar.
Conclusão
FLUX.1 Kontext é uma família de modelos de edição de imagem com consciência de contexto — não um sistema texto-para-imagem. Sua capacidade central é preservar a identidade do sujeito, relações espaciais e estilo enquanto aplica edições precisas orientadas por texto a uma imagem existente. Essa distinção importa ao escolhê-lo em vez de FLUX.1 Dev, Schnell ou outros modelos T2I: Kontext é a ferramenta certa quando você tem imagens de origem e precisa alterar algo específico nelas.
Entre os três níveis na Novita AI, a lógica de seleção é direta. Dev é a escolha certa para fluxos de alto rendimento ou sensíveis a custo — ele expõe controle de etapas de inferência e dimensionamento em nível de pixel, e o modo rápido reduz o preço para $0,018/imagem. Pro é o padrão para a maioria dos casos de uso em produção: interface de proporção mais simples, melhor consistência de saída que Dev e um preço intermediário ($0,036/imagem) que funciona para pipelines contínuos. Max visa a produção de ativos finais onde o teto de qualidade importa mais que o custo — ele compartilha a interface do Pro, mas oferece maior consistência, sendo a escolha certa para imagens de marca, trabalhos prontos para impressão ou qualquer saída que vá diretamente para o público sem edição adicional.
Todas as três variantes aceitam até 4 imagens de origem e retornam resultados através da mesma API de tarefa assíncrona, então a seleção de nível é, na prática, uma mudança de endpoint de uma linha. O nível certo depende de onde a saída será usada: pipelines automatizados tendem ao Dev, APIs de produção tendem ao Pro, entrega final tende ao Max.
FAQ
P: Qual é a maior diferença prática entre Dev, Pro e Max?
R: Dev oferece controle direto sobre as etapas de inferência e dimensões dos pixels de saída, além de uma opção de modo rápido que reduz o custo em detrimento de alguma qualidade. Pro e Max usam predefinições de proporção e fixam o pipeline de inferência — Pro é a opção de produção equilibrada, Max é o teto de qualidade mais alto. Os preços refletem isso: Dev a partir de $0,018, Pro $0,036, Max $0,072 por imagem na Novita AI (verificado em 26/06/2026).
P: Com qual nível devo começar?
R: Comece com Pro. Ele cobre a maioria dos casos de uso de edição de imagem em produção com uma interface simples e saída confiável. Mude para Dev se precisar de controle de custo de throughput ou dimensões de pixels personalizadas; vá para Max se as saídas do Pro forem inconsistentes ou se estiver produzindo ativos finais que vão diretamente para o público.
P: Quando vale a pena atualizar de Pro para Max?
R: Quando a consistência da saída importa mais que o custo. Sinais comuns: resultados do Pro divergem em um lote quando a preservação da identidade é crítica (mesmo personagem ou produto em várias edições), edições de tipografia fina estão degradando, ou a saída vai diretamente para produção sem uma etapa de controle de qualidade humano. Max não expõe parâmetros diferentes — é a mesma interface do Pro, apenas um teto de qualidade mais alto.
P: O modo rápido do Dev reduz a qualidade de forma perceptível?
R: Para edições simples — mudanças de cor sólida, troca de fundo, remoção de objeto — a qualidade do modo rápido geralmente é aceitável. Para composição complexa, mudanças precisas de tipografia ou edições que exigem forte consistência do sujeito, o Dev padrão ou Pro produz resultados mais confiáveis. O modo rápido é melhor tratado como um nível de triagem ou prototipagem, não um nível de saída final.
P: Qual é a diferença entre FLUX.1 Kontext e os modelos texto-para-imagem FLUX.1?
R: FLUX.1 Kontext (Dev/Pro/Max) é um modelo de edição de imagem: ele recebe uma ou mais imagens de origem mais uma instrução textual e retorna uma versão editada. FLUX.1 [dev] e [schnell] são modelos texto-para-imagem: geram imagens a partir de um prompt de texto sem necessidade de entrada de imagem. As duas famílias resolvem problemas diferentes e não são intercambiáveis — use Kontext quando tiver imagens de origem para editar, e modelos T2I quando gerar do zero.
