MiniMax Hailuo 2.3 na Novita AI: Texto para Vídeo vs Imagem para Vídeo vs Modo Rápido

MiniMax Hailuo 2.3 na Novita AI: Texto para Vídeo vs Imagem para Vídeo vs Modo Rápido

O MiniMax Hailuo 2.3 na Novita AI é mais fácil de escolher começando pela sua entrada: use Texto para Vídeo quando a cena existe apenas como um prompt, use Imagem para Vídeo quando um primeiro quadro ou imagem de referência deve ancorar o clipe, e use Fast Image to Video quando você já tem uma imagem e deseja testar o endpoint Fast I2V de menor preço antes de gastar no I2V padrão.

Tabela de Seleção de Modo do MiniMax Hailuo 2.3

Decisão Comece aqui Porquê
Você tem apenas uma cena escrita Hailuo 2.3 Texto para Vídeo O endpoint T2V requer prompt e não requer uma imagem.
Você tem um quadro de produto, quadro de personagem, quadro de storyboard ou visual aprovado Hailuo 2.3 Imagem para Vídeo O endpoint I2V requer tanto prompt quanto image, então a imagem de entrada ancora o estado visual inicial.
Você tem uma imagem e precisa de uma primeira passagem I2V mais barata Hailuo 2.3 Fast Image to Video As linhas de preço do Fast I2V são mais baixas que o I2V padrão para as mesmas combinações de duração e resolução visíveis.
Você precisa de saída 1080P Qualquer um dos três modos, limitado a 6 segundos A documentação da Novita lista suporte a 1080P para jobs Hailuo 2.3 de 6 segundos; jobs de 10 segundos são listados apenas em 768P.
Você precisa de um clipe de 10 segundos T2V, I2V ou Fast I2V em 768P A documentação lista 10 segundos como duração disponível, com 768P como resolução suportada para 10 segundos.
Você precisa de comandos de câmera via prompt documentados na referência da API T2V ou I2V padrão As documentações T2V e I2V listam 15 comandos de câmera suportados; a página do Fast I2V não lista essa seção de comandos de câmera.
Você está planejando um lote amplo de testes Comece com 6s 768P; use Fast I2V apenas quando uma imagem estiver disponível 6s 768P é a linha visível mais baixa para cada modo, e Fast I2V é a linha I2V Hailuo 2.3 visível mais baixa.
Você está produzindo um clipe quase final apenas com prompt T2V na resolução e duração alvo T2V é o único endpoint da família Hailuo 2.3 aqui que não precisa de entrada de imagem.
Você está produzindo um clipe quase final liderado por ativo I2V padrão na resolução e duração alvo I2V padrão mantém o fluxo liderado por imagem enquanto usa o endpoint não-Fast.

A distinção importante não é “qual modo é melhor” no abstrato. É se seu primeiro teste útil deve ser apenas com prompt, liderado por imagem, ou uma passagem Fast I2V de menor preço. Se uma imagem de origem não estiver disponível, o modo Fast não é uma opção, pois o Fast Hailuo 2.3 é documentado como um endpoint de imagem para vídeo.

Modos da API MiniMax Hailuo 2.3 na Novita AI

A Novita AI documenta três APIs de vídeo MiniMax Hailuo 2.3 assíncronas separadas:

Modo Caminho da API Novita Entradas obrigatórias Controles compartilhados
MiniMax Hailuo 2.3 Texto para Vídeo POST /v3/async/minimax-hailuo-2.3-t2v prompt duration, resolution, enable_prompt_expansion, fast_pretreatment
MiniMax Hailuo 2.3 Imagem para Vídeo POST /v3/async/minimax-hailuo-2.3-i2v prompt, image duration, resolution, enable_prompt_expansion, fast_pretreatment
MiniMax Hailuo 2.3 Fast Image to Video POST /v3/async/minimax-hailuo-2.3-fast-i2v prompt, image duration, resolution, enable_prompt_expansion

Todos os três endpoints são assíncronos. A requisição de criação retorna um task_id, não uma URL de vídeo finalizada. As aplicações devem armazenar o ID da tarefa e usar a API de Resultado de Tarefa da Novita AI para recuperar a saída gerada quando o job for concluído.

As referências da API Hailuo 2.3 verificadas em 23 de junho de 2026 listam opções de duration de 6 e 10. Elas listam padrões de resolution em 768P, com 768P e 1080P disponíveis para vídeos de 6 segundos e 768P disponível para vídeos de 10 segundos. O campo prompt é obrigatório nos três modos e suporta de 1 a 2000 caracteres.

Para modos liderados por imagem, o campo image suporta uma URL pública ou URL de dados Base64, como data:image/jpeg;base64,.... Isso torna I2V e Fast I2V mais adequados para fluxos de trabalho onde a semente visual já existe em armazenamento, uma ferramenta de design, um catálogo de produtos ou uma etapa de geração anterior.

Qual é a Diferença Entre T2V, I2V e Fast I2V?

Escolha Hailuo 2.3 Texto para Vídeo quando a primeira versão do clipe deve vir apenas da linguagem. Este é o ponto de partida mais limpo para exploração de conceitos, ideação de cenas, planejamento de tomadas e testes de prompt onde você ainda não tem uma imagem fixa de produto ou quadro de personagem.

T2V também é a forma de requisição mais simples. Não tem requisito de upload de imagem ou URL de imagem, então um produto pode coletar um prompt, escolher duração e resolução, enviar a tarefa e consultar o resultado. Use quando os critérios de aceitação são sobre a ideia da cena, não a fidelidade a uma imagem inicial específica.

Escolha Hailuo 2.3 Imagem para Vídeo quando a imagem de entrada faz parte dos critérios de aceitação. Uma imagem estática de produto, quadro de personagem aprovado, visual de marca, painel de storyboard ou keyframe gerado não deve ser recriado a partir de texto se você já tem o ativo. Use I2V para que a geração comece a partir da imagem que você fornece.

O I2V padrão também se encaixa em fluxos de revisão onde um designer, profissional de marketing ou equipe de produto aprova um quadro estático antes que o movimento seja adicionado. A imagem de entrada se torna o ponto de referência para o clipe, enquanto o prompt descreve como a cena deve se mover.

Escolha Hailuo 2.3 Fast Image to Video quando você já tem uma imagem e deseja testar os preços mais baixos listados do endpoint Fast I2V. Fast I2V não é um modo apenas com prompt; ainda requer image mais prompt. Portanto, é uma escolha de custo e endpoint dentro de um fluxo liderado por imagem, não um substituto para T2V.

A documentação descreve Fast Hailuo 2.3 como acelerado e posicionado para equilibrar qualidade e desempenho a uma taxa mais econômica. Para planejamento prático, trate isso como uma razão para testá-lo cedo com seus próprios ativos, em vez de assumir que sempre substituirá o I2V padrão. Se Fast I2V passar em seus critérios de aceitação visual, pode ser a melhor via de iteração. Se não, mova a mesma imagem e direção de prompt para o I2V padrão.

Há uma diferença de controle documentada a notar. Os corpos de requisição T2V e I2V padrão incluem fast_pretreatment; o corpo de requisição Fast I2V mostrado na documentação não inclui. As documentações T2V e I2V padrão também listam 15 comandos de câmera suportados, incluindo pan, tilt, zoom, truck, push, pull, pedestal, shake, tracking shot e static shot. A página Fast I2V verificada para este artigo não inclui essa seção de comandos de câmera, então evite prometer comportamento idêntico de comandos de câmera nos três modos a menos que seus próprios testes confirmem.

Quanto Custa o Hailuo 2.3 na Novita AI?

Os dados atuais da biblioteca de modelos e preços da Novita verificados em 23 de junho de 2026 listam as seguintes linhas do MiniMax Hailuo 2.3:

Modo Duração Resolução Preço
Hailuo 2.3 Texto para Vídeo 6s 768P $0,28/vídeo
Hailuo 2.3 Texto para Vídeo 10s 768P $0,56/vídeo
Hailuo 2.3 Texto para Vídeo 6s 1080P $0,49/vídeo
Hailuo 2.3 Imagem para Vídeo 6s 768P $0,28/vídeo
Hailuo 2.3 Imagem para Vídeo 10s 768P $0,56/vídeo
Hailuo 2.3 Imagem para Vídeo 6s 1080P $0,49/vídeo
Hailuo 2.3 Fast Image to Video 6s 768P $0,19/vídeo
Hailuo 2.3 Fast Image to Video 10s 768P $0,32/vídeo
Hailuo 2.3 Fast Image to Video 6s 1080P $0,33/vídeo

Duas conclusões de preço importam para o planejamento. Primeiro, T2V padrão e I2V padrão têm as mesmas linhas de preço visíveis na mesma duração e resolução. Escolha entre eles com base na entrada, não no custo. Segundo, Fast I2V tem preço mais baixo que o I2V padrão nas linhas Hailuo 2.3 visíveis, mas requer uma imagem e deve ser avaliado contra seus próprios critérios de saída.

Para exploração inicial, 6s em 768P é a opção visível mais baixa em cada modo. Para um teste apenas com prompt, isso significa $0,28/vídeo com T2V. Para um teste liderado por imagem, isso significa $0,28/vídeo com I2V padrão ou $0,19/vídeo com Fast I2V.

Para 1080P, as linhas Hailuo 2.3 visíveis são jobs de 6 segundos: $0,49/vídeo para T2V ou I2V padrão, e $0,33/vídeo para Fast I2V. Para jobs de 10 segundos, as linhas visíveis são 768P: $0,56/vídeo para T2V ou I2V padrão, e $0,32/vídeo para Fast I2V.

Os preços podem mudar. Antes de um lote de alto volume, verifique a linha exata na biblioteca de modelos da Novita AI ou na visualização de preços do console.

Qual Modo Você Deve Testar Primeiro?

Se a ideia ainda vive apenas em um briefing, comece com T2V. Mantenha o primeiro prompt curto, escolha 6s 768P e adicione direção de câmera apenas quando afetar a revisão. Isso mantém a primeira passagem leve: sem preparação de imagem, sem upload de ativo, apenas uma verificação rápida se o conceito da cena vale a pena ser desenvolvido.

Se a imagem já faz parte do briefing, use I2V padrão primeiro. Uma imagem estática de produto, quadro de personagem ou painel de storyboard muda o trabalho de “inventar uma cena” para “animar este ponto de partida exato”. T2V pode criar algo plausível, mas não pode preservar uma imagem de origem específica a menos que essa imagem seja passada para um endpoint I2V.

Fast I2V é útil quando você já tem a imagem e quer mais espaço para experimentar antes de selecionar finalistas. Porque tem as linhas de preço Hailuo 2.3 visíveis mais baixas para jobs liderados por imagem, é uma via sensata para testar direção de movimento, redação de prompt e se a imagem de origem funciona como semente. Após essa passagem, continue usando Fast I2V se a saída atender ao seu padrão, ou mova os candidatos mais fortes para o I2V padrão.

A principal armadilha é escolher Fast I2V cedo demais. Ainda é imagem para vídeo, então não é um atalho para um briefing escrito sem imagem anexada. Nesse caso, T2V é o melhor primeiro teste.

Para exploração ampla, 768P geralmente é suficiente para julgar direção do prompt, adequação da imagem e ideias de movimento. Reserve 1080P para o conjunto menor de clipes que estão próximos o suficiente para inspecionar em detalhes.

Use testes de 10 segundos quando o tempo extra mudar a decisão criativa, não como a primeira passagem padrão. A linha Hailuo 2.3 documentada para jobs de 10 segundos é 768P; se sua equipe precisa de 1080P, planeje em torno de jobs de 6 segundos ou confirme se o console ao vivo adicionou uma opção mais recente antes de se comprometer com um lote.

Fluxo de Trabalho da API MiniMax Hailuo 2.3

Uma integração de produção deve tratar o Hailuo 2.3 como um fluxo de trabalho de job assíncrono:

  1. Escolha T2V, I2V ou Fast I2V a partir da entrada disponível.
  2. Escolha duração de 6s ou 10s.
  3. Escolha 768P ou 1080P, notando que 1080P é documentado para jobs de 6 segundos.
  4. Envie a requisição para o endpoint assíncrono específico do modelo.
  5. Armazene o task_id retornado.
  6. Consulte a API de Resultado de Tarefa até que a tarefa tenha sucesso ou falhe.
  7. Armazene a URL de mídia retornada de acordo com as regras de retenção do seu produto.

Aqui está uma requisição mínima de texto para vídeo:

curl --location --request POST 'https://api.novita.ai/v3/async/minimax-hailuo-2.3-t2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "prompt": "A compact smart speaker on a kitchen counter lights up as the camera slowly pushes in. Soft morning light, clean product demo, no text overlays.",
    "duration": 6,
    "resolution": "768P",
    "enable_prompt_expansion": true,
    "fast_pretreatment": false
  }'

Aqui está uma requisição mínima de imagem para vídeo:

curl --location --request POST 'https://api.novita.ai/v3/async/minimax-hailuo-2.3-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.jpg",
    "prompt": "Animate the product with a subtle light pulse while the camera makes a slow push-in. Keep the product centered and avoid adding text.",
    "duration": 6,
    "resolution": "768P",
    "enable_prompt_expansion": true,
    "fast_pretreatment": false
  }'

Aqui está o mesmo teste liderado por imagem usando Fast I2V:

curl --location --request POST 'https://api.novita.ai/v3/async/minimax-hailuo-2.3-fast-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.jpg",
    "prompt": "Animate the product with a subtle light pulse while the camera makes a slow push-in. Keep the product centered and avoid adding text.",
    "duration": 6,
    "resolution": "768P",
    "enable_prompt_expansion": true
  }'

Nos três casos, construa para estados enfileirado, processando, sucesso e falha. A resposta inicial fornece um ID de tarefa; isso não significa que o vídeo já está disponível.

Recomendação Final

Para a maioria das equipes, o primeiro teste MiniMax Hailuo 2.3 deve ser 6s 768P. Use T2V se você tem apenas um prompt. Use I2V padrão se o primeiro quadro ou imagem de referência é inegociável. Use Fast I2V se você tem uma imagem e quer uma via de iteração de menor preço antes de decidir quais saídas merecem I2V padrão ou revisão 1080P.

Essa sequência mantém a primeira passagem ligada à restrição real de entrada. Também evita um erro comum: tratar o modo Fast como um atalho universal. Fast Hailuo 2.3 é um endpoint de imagem para vídeo, então é útil apenas depois que uma imagem existe.

FAQ

O MiniMax Hailuo 2.3 está disponível para texto para vídeo na Novita AI?

Sim. A Novita AI documenta POST /v3/async/minimax-hailuo-2.3-t2v para MiniMax Hailuo 2.3 Texto para Vídeo.

O MiniMax Hailuo 2.3 está disponível para imagem para vídeo na Novita AI?

Sim. A Novita AI documenta POST /v3/async/minimax-hailuo-2.3-i2v para Imagem para Vídeo padrão e POST /v3/async/minimax-hailuo-2.3-fast-i2v para Fast Image to Video.

Qual é a diferença entre Hailuo 2.3 I2V e Fast I2V?

Ambos requerem prompt e image. O endpoint Fast I2V tem linhas de preço visíveis mais baixas que o I2V padrão e é documentado separadamente como minimax-hailuo-2.3-fast-i2v. I2V padrão inclui fast_pretreatment no corpo da requisição documentado; Fast I2V não mostra esse campo.

O Hailuo 2.3 suporta 1080P?

Sim, para jobs de 6 segundos. As documentações Hailuo 2.3 verificadas em 23 de junho de 2026 listam 768P e 1080P para vídeos de 6 segundos e 768P apenas para vídeos de 10 segundos.

Quanto custa o MiniMax Hailuo 2.3 na Novita AI?

As linhas visíveis verificadas em 23 de junho de 2026 começam em $0,28/vídeo para T2V ou I2V padrão 6s 768P, $0,19/vídeo para Fast I2V 6s 768P, $0,49/vídeo para T2V ou I2V padrão 6s 1080P e $0,33/vídeo para Fast I2V 6s 1080P.

Artigos recomendados