Seedance V1.5 Pro na Novita AI: Texto para Vídeo vs Imagem para Vídeo, Áudio e Modos Silenciosos

Seedance V1.5 Pro na Novita AI: Texto para Vídeo vs Imagem para Vídeo, Áudio e Modos Silenciosos

O Seedance V1.5 Pro na Novita AI é mais fácil de escolher começando pelo ativo que você já possui: use texto para vídeo quando a cena começa a partir de um prompt, use imagem para vídeo quando um primeiro quadro ou uma configuração de primeiro e último quadro deve guiar o resultado, mantenha a saída silenciosa para iteração visual inicial, adicione áudio apenas quando fala, efeitos sonoros ou música fizerem parte dos critérios de aceitação, e use o nível de serviço flex para trabalhos em lote que não são sensíveis à latência.

Tabela de Seleção Rápida do Seedance V1.5 Pro

Decisão Comece aqui Porquê
Você tem apenas uma cena escrita Texto para vídeo O endpoint T2V requer um prompt e pode escolher uma proporção adaptativa a partir do prompt.
Você tem uma foto de produto, quadro de personagem, quadro de storyboard ou visual aprovado Imagem para vídeo O endpoint I2V requer image mais prompt, então o primeiro quadro ancora o clipe gerado.
Você precisa de um início e fim controlados Imagem para vídeo com last_image A API I2V suporta last_image opcional para geração de primeiro e último quadro.
Você precisa de fala gerada, efeitos sonoros ou música de fundo Defina generate_audio: true O áudio é gerado a partir do prompt e do conteúdo visual quando habilitado.
Você adicionará seu próprio áudio depois Defina generate_audio: false A saída silenciosa evita pagar por áudio gerado que você descartará.
Você precisa de um resultado voltado para o usuário mais rapidamente Use service_tier: "default" A documentação descreve default como inferência online para cenários sensíveis ao tempo.
Você pode esperar e quer um custo unitário menor Use service_tier: "flex" A documentação descreve flex como inferência offline a 50% do preço do modo online.
Você está explorando prompts Comece com 480p silencioso flex quando a latência não é importante Isso mantém a exploração inicial mais barata antes de regenerar finalistas.
Você está revisando clipes quase finais Mude para 720p e ative o áudio apenas se ele fizer parte dos critérios de aceitação 720p custa mais que 480p, e o áudio dobra a taxa por segundo listada.

Modos do Seedance V1.5 Pro Disponíveis na Novita AI

A Novita AI expõe o Seedance V1.5 Pro através de APIs de vídeo assíncronas separadas:

Modo Caminho da API Novita Entradas obrigatórias Entradas opcionais e controles
Seedance V1.5 Pro Texto para Vídeo POST /v3/async/seedance-v1.5-pro-t2v prompt fps, seed, ratio, duration, watermark, resolution, camera_fixed, service_tier, generate_audio, execution_expires_after
Seedance V1.5 Pro Imagem para Vídeo POST /v3/async/seedance-v1.5-pro-i2v image, prompt fps, seed, ratio, duration, watermark, last_image, resolution, camera_fixed, service_tier, generate_audio, execution_expires_after

Ambas as APIs retornam primeiro um ID de tarefa, não um vídeo finalizado. As aplicações devem chamar a API de Resultado de Tarefa da Novita AI para verificar o status e recuperar a mídia gerada após a conclusão da tarefa.

Os controles compartilhados da requisição são importantes para o design do produto. A documentação lista duration como um valor de 4 a 12 segundos, fps como 24, opções de ratio incluindo 16:9, 4:3, 1:1, 3:4, 9:16, 21:9 e adaptive, e opções de resolution de 480p, 720p e 1080p. O campo execution_expires_after tem valor padrão de 172800 segundos, com um intervalo documentado de 3600 a 259200 segundos.

Seedance V1.5 Pro Texto para Vídeo vs Imagem para Vídeo

Escolha texto para vídeo quando a ideia ainda é verbal. Se seu fluxo de trabalho começa com uma linha de roteiro, direção de câmera, descrição do sujeito ou briefing criativo, o T2V mantém a primeira passagem leve. É o modo mais limpo para ideação, exploração de prompts e casos onde a identidade exata do produto ou personagem não é o principal critério de aceitação.

Escolha imagem para vídeo quando o primeiro visual importa. I2V é melhor para imagens de produto, quadros de design, referências de personagem, miniaturas, painéis de storyboard e visuais controlados pela marca. Não garante preservação perfeita de identidade em todos os quadros, mas dá à geração um ponto de partida concreto que o T2V apenas com prompt não tem.

O campo extra exclusivo do I2V é last_image. Use-o quando um clipe precisa se mover de um quadro inicial conhecido para um quadro final conhecido. Isso é útil para testes de transição, revelações curtas de produto, movimentos simples de antes-e-depois e cenas storyboardadas onde a composição final já está decidida. Quando as proporções do primeiro e último quadro diferem, a documentação diz que o último quadro é automaticamente cortado para corresponder ao primeiro, então as equipes devem preparar proporções correspondentes quando o enquadramento visual for importante.

Para conceitos baseados apenas em prompt, o T2V geralmente é o primeiro teste. Para conceitos baseados em ativos, o I2V geralmente é o primeiro teste. Se você já conhece o quadro inicial, não force o modelo a redescobri-lo a partir do texto.

Seedance V1.5 Pro Áudio vs Saída Silenciosa

O Seedance V1.5 Pro tem um interruptor de áudio direto através de generate_audio. Quando é true, o vídeo gerado inclui áudio sincronizado, como fala gerada automaticamente, efeitos sonoros e música de fundo com base no prompt e no conteúdo visual. Quando é false, a saída é silenciosa.

O áudio muda a escrita do prompt. Se a fala gerada faz parte do teste, escreva a linha falada explicitamente e separe-a da ação visual e do som ambiente. Um prompt de cena vago pode ser suficiente para exploração visual, mas geralmente não é suficiente para uma revisão confiável de áudio.

O áudio também muda o custo. Os dados atuais da página de preços da Novita verificados em 22 de junho de 2026 listam linhas de áudio com o dobro do preço das linhas silenciosas correspondentes para Seedance V1.5 Pro T2V e I2V em 480P e 720P. Se seu produto adicionará narração, trilha sonora ou design de som em um pipeline separado, gere vídeo silencioso para as primeiras passagens. Se a fala sincronizada ou o áudio da cena fizerem parte do requisito real do produto, teste o áudio cedo porque isso afeta tanto os critérios de revisão quanto o orçamento.

Seedance V1.5 Pro Online vs Processamento em Lote Flex

O campo service_tier é a principal escolha de nível de processamento. A documentação do Seedance V1.5 Pro descreve default como inferência online com cotas menores de RPM e concorrência para cenários sensíveis ao tempo. Ela descreve flex como inferência offline com cotas mais altas de TPD a 50% do preço do modo online para cenários insensíveis à latência.

Para o design da aplicação, trate default como a via interativa e flex como a via de lote. Uma ferramenta criativa voltada para o usuário onde alguém está esperando na interface deve começar com default. Uma varredura noturna de prompts, avaliação criativa em estilo de conjunto de dados, grande fila de revisão interna ou lote de campanha não urgente pode usar flex.

Essa distinção é separada do padrão de API assíncrona. Ambos os modos ainda retornam um ID de tarefa primeiro. A diferença é o nível de processamento e o perfil de custo, não se a API é síncrona.

Seedance V1.5 Pro Resolução: 480p vs 720p vs 1080p

A documentação atual do Seedance V1.5 Pro lista 480p, 720p e 1080p como valores suportados de resolution. Os dados atuais da página de preços expõem linhas de preço detalhadas para 480P e 720P para Seedance V1.5 Pro T2V e I2V. Os mesmos dados da página não expuseram uma linha de preço correspondente para Seedance V1.5 Pro 1080P nos dados verificados para esta revisão, portanto, os planos de orçamento de produção devem verificar a página de preços ao vivo ou o console antes de usar 1080p em escala.

Para a maioria das equipes, 480p é a configuração de exploração correta. É suficiente para julgar a direção do prompt, movimento aproximado, se uma referência de imagem está ajudando e se o áudio deve permanecer no escopo. Regere os candidatos finalistas em 720p quando a revisão visual importa mais do que o custo de exploração.

Use 1080p apenas após confirmar tanto a disponibilidade quanto a cobrança para a forma exata de trabalho que você planeja executar. O campo da API o suporta, mas fazer orçamento apenas com base nas linhas visíveis de 480P e 720P seria incompleto.

Preços do Seedance V1.5 Pro por Resolução, Áudio e Lote Flex

Os dados atuais da página de preços da Novita verificados em 22 de junho de 2026 listam os seguintes preços do Seedance V1.5 Pro tanto para texto para vídeo quanto para imagem para vídeo. Os mesmos preços aparecem para I2V de primeiro quadro e I2V de primeiro e último quadro.

Modo Resolução Saída Online, default Lote flex, flex
T2V ou I2V 480P Silencioso $0,012/s $0,006/s
T2V ou I2V 480P Áudio $0,024/s $0,012/s
T2V ou I2V 720P Silencioso $0,026/s $0,013/s
T2V ou I2V 720P Áudio $0,052/s $0,026/s

Os multiplicadores de custo são a parte útil:

  • Áudio custa o dobro da linha silenciosa correspondente.
  • Lote flex custa metade da linha online correspondente.
  • 720P custa um pouco mais que o dobro da linha 480P correspondente.
  • T2V e I2V têm a mesma taxa listada na mesma resolução, configuração de áudio e nível de serviço.

Para um clipe de áudio de 10 segundos em 720P, o custo online listado é 10 x $0,052, ou $0,52. O mesmo clipe através de flex é 10 x $0,026, ou $0,26, quando a latência é aceitável. Para um clipe de exploração silencioso de 10 segundos em 480P, o custo flex listado é 10 x $0,006, ou $0,06.

Isso torna o caminho de teste inicial direto: reduza o custo desativando o áudio, usando 480P e usando flex quando a revisão não precisar de um resultado imediato. Aumente o custo apenas quando o clipe estiver próximo o suficiente para ser avaliado com qualidade final.

Qual Modo do Seedance V1.5 Pro Você Deve Testar Primeiro?

Comece com T2V quando você ainda está procurando a cena. Escreva de cinco a dez prompts compactos, mantenha a duração curta o suficiente para revisão, use 480p e deixe o áudio desligado a menos que a fala seja a ideia central. O objetivo é descobrir se o conceito funciona antes de introduzir restrições de ativos.

Comece com I2V quando o ativo já é o conceito. Se um quadro de produto, referência de personagem ou composição aprovada é inegociável, use essa imagem desde o primeiro teste. Um prompt T2V pode criar uma cena plausível, mas não saberá a imagem de referência exata a menos que você a forneça.

Comece com I2V mais last_image quando a transição importa mais do que o movimento aberto. Este é o teste inicial certo para uma composição inicial e final conhecidas. Mantenha a primeira e a última imagem próximas em proporção e evite sobrecarregar o prompt com muitas ações não relacionadas.

Comece silencioso a menos que o áudio faça parte dos critérios de aceitação. Uma vez que a direção visual é aceitável, ative generate_audio se necessário e escreva a linha falada ou sugestão sonora explicitamente.

Comece com flex para filas e default para UI ao vivo. Se a geração está indo para um pipeline de revisão em segundo plano, use flex e gaste a economia em mais variantes. Se um usuário está esperando em uma superfície de produto, use default e projete a interface em torno do progresso da tarefa.

Fluxo de Trabalho da API do Seedance V1.5 Pro na Novita AI

Um fluxo de trabalho de produção deve tratar ambos os modos do Seedance V1.5 Pro como trabalhos assíncronos:

  1. Escolha T2V ou I2V com base em se você tem uma imagem de entrada.
  2. Escolha silencioso ou áudio com generate_audio.
  3. Escolha default ou flex com service_tier.
  4. Escolha resolução e duração.
  5. Envie a tarefa para o endpoint específico do modelo.
  6. Armazene o ID da tarefa retornado.
  7. Consulte a API de Resultado da Tarefa até que a tarefa seja bem-sucedida ou falhe.
  8. Armazene a URL do vídeo retornada antes que a URL expire.

Aqui está um formato mínimo de requisição de texto para vídeo:

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-t2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "prompt": "Um clipe de demonstração de produto mostrando uma lâmpada inteligente compacta acendendo em um estúdio limpo. Movimento lento de câmera push-in, sombras suaves, fundo neutro.",
    "duration": 5,
    "resolution": "480p",
    "ratio": "16:9",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

Aqui está um formato mínimo de requisição de imagem para vídeo:

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.png",
    "prompt": "Anime a lâmpada com um pulso de luz suave enquanto a câmera faz um movimento sutil para frente. Mantenha o produto centralizado e evite sobreposições de texto.",
    "duration": 5,
    "resolution": "480p",
    "ratio": "adaptive",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

Após o envio, use o ID da tarefa retornado com a API de Resultado da Tarefa. Construa para estados de enfileirado, processando, bem-sucedido e falhou, em vez de assumir que uma URL de vídeo estará disponível imediatamente.

Recomendação Final para o Seedance V1.5 Pro

Para a maioria das equipes, o melhor primeiro teste do Seedance V1.5 Pro é 480P, silencioso e flex: T2V se você tem apenas um conceito escrito, I2V se você tem uma imagem de origem. Mude para 720P depois que o prompt ou a imagem de referência estiverem próximos. Ative o áudio apenas quando fala gerada, efeitos sonoros ou música fizerem parte da revisão. Use default quando o resultado for voltado para o usuário e sensível ao tempo; use flex quando a tarefa puder esperar.

Essa sequência mantém a primeira avaliação barata sem alterar o fluxo principal da API. Assim que um clipe passar pela revisão visual, aumente a resolução, ative o áudio se necessário e execute um conjunto menor de candidatos finais.

FAQ

O Seedance V1.5 Pro está disponível tanto para texto para vídeo quanto para imagem para vídeo na Novita AI?

Sim. A Novita AI documenta endpoints separados do Seedance V1.5 Pro T2V e I2V: POST /v3/async/seedance-v1.5-pro-t2v e POST /v3/async/seedance-v1.5-pro-i2v.

O Seedance V1.5 Pro gera áudio?

Sim. O campo generate_audio controla se a saída inclui áudio sincronizado. Defina como true para fala gerada, efeitos sonoros ou música de fundo, e false para vídeo silencioso.

Imagem para vídeo é mais caro que texto para vídeo?

Os dados atuais da página de preços verificados para este artigo listam as mesmas taxas do Seedance V1.5 Pro para T2V e I2V na mesma resolução, configuração de áudio e nível de serviço.

Qual é a diferença entre processamento online e flex?

A documentação descreve default como inferência online para cenários sensíveis ao tempo e flex como inferência offline para cenários insensíveis à latência a 50% do preço do modo online.

Devo testar 480P ou 720P primeiro?

Use 480P para exploração ampla de prompts e imagens de referência. Use 720P quando o conceito estiver próximo o suficiente para uma revisão visual mais séria. Verifique a cobrança de 1080P antes de usá-lo em uma execução grande.

Artigos recomendados