API de Seedance V1.5 Pro: Texto a Video vs Imagen a Video, Modos de Audio y Silencio

Tabla de contenido

Tabla de selección rápida de Seedance V1.5 Pro
Modos de texto a video e imagen a video de Seedance V1.5 Pro en Novita AI
Seedance V1.5 Pro: texto a video vs imagen a video
Audio de Seedance V1.5 Pro vs salida silenciosa
Seedance V1.5 Pro: procesamiento en línea vs lotes flex
Resolución de Seedance V1.5 Pro: 480p vs 720p vs 1080p
Precios de Seedance V1.5 Pro por resolución, audio y lotes flex
¿Qué modo de Seedance V1.5 Pro deberías probar primero?
API de Seedance V1.5 Pro: flujo de trabajo completo en Novita AI
Recomendación final para Seedance V1.5 Pro
Preguntas frecuentes

Seedance V1.5 Pro en Novita AI es más fácil de elegir comenzando con el activo que ya tienes: usa texto a video cuando la escena parte de un prompt, usa imagen a video cuando un primer fotograma o una configuración de primer y último fotograma debe guiar el resultado, mantén la salida en silencio para iteraciones visuales tempranas, agrega audio solo cuando el habla, efectos de sonido o música sean parte de la aceptación, y usa el nivel de servicio flex para trabajos por lotes que no son sensibles a la latencia.

Si estás comparando Seedance con otras opciones de generación de video, comienza con la visión general de alternativas a Sora para generación de video AI de Novita AI, luego usa esta guía para afinar las decisiones específicas de Seedance: modo, audio, resolución y nivel de servicio. Para una comparación directa modelo a modelo, Kling V2.5 Turbo cubre T2V e I2V con precios predecibles por video sin división entre flex/en línea, mientras que MiniMax Hailuo 2.3 agrega un endpoint I2V rápido a precios más bajos para flujos de trabajo basados en imágenes.

Tabla de selección rápida de Seedance V1.5 Pro

Decisión	Empieza aquí	Por qué
Solo tienes una escena escrita	Texto a video	El endpoint T2V requiere un `prompt` y puede elegir una relación de aspecto adaptativa a partir del prompt.
Tienes una toma de producto, fotograma de personaje, storyboard o un visual aprobado	Imagen a video	El endpoint I2V requiere `image` más `prompt`, por lo que el primer fotograma ancla el clip generado.
Necesitas un inicio y un final controlados	Imagen a video con `last_image`	La API I2V admite `last_image` opcional para generación de primer y último fotograma.
Necesitas habla generada, efectos de sonido o música de fondo	Configura `generate_audio: true`	El audio se genera a partir del prompt y el contenido visual cuando está habilitado.
Agregarás tu propio audio más tarde	Configura `generate_audio: false`	La salida silenciosa evita pagar por audio generado que descartarás.
Necesitas un resultado visible para el usuario más pronto	Usa `service_tier: "default"`	Los docs describen `default` como inferencia en línea para escenarios sensibles al tiempo.
Puedes esperar y quieres un costo unitario más bajo	Usa `service_tier: "flex"`	Los docs describen `flex` como inferencia fuera de línea al 50% del precio del modo en línea.
Estás explorando prompts	Empieza en 480p silencioso y flex cuando la latencia no sea importante	Mantiene la exploración temprana más barata antes de regenerar los finalistas.
Estás revisando clips casi finales	Pasa a 720p y habilita el audio solo si es parte de la aceptación	720p cuesta más que 480p, y el audio duplica la tarifa por segundo listada.

Modos de texto a video e imagen a video de Seedance V1.5 Pro en Novita AI

Novita AI expone Seedance V1.5 Pro a través de APIs de video asíncronas separadas:

Modo	Ruta de API de Novita	Entradas requeridas	Entradas y controles opcionales
Seedance V1.5 Pro Texto a Video	`POST /v3/async/seedance-v1.5-pro-t2v`	`prompt`	`fps`, `seed`, `ratio`, `duration`, `watermark`, `resolution`, `camera_fixed`, `service_tier`, `generate_audio`, `execution_expires_after`
Seedance V1.5 Pro Imagen a Video	`POST /v3/async/seedance-v1.5-pro-i2v`	`image`, `prompt`	`fps`, `seed`, `ratio`, `duration`, `watermark`, `last_image`, `resolution`, `camera_fixed`, `service_tier`, `generate_audio`, `execution_expires_after`

Ambas APIs devuelven primero un ID de tarea, no un video terminado. Las aplicaciones deben llamar a la API de resultado de tarea de Novita AI para verificar el estado y recuperar los medios generados después de que la tarea se complete.

Los controles compartidos de la solicitud son importantes para el diseño del producto. Los docs enumeran duration como un valor de 4 a 12 segundos, fps como 24, opciones de ratio que incluyen 16:9, 4:3, 1:1, 3:4, 9:16, 21:9 y adaptive, y opciones de resolution de 480p, 720p y 1080p. El campo execution_expires_after tiene un valor predeterminado de 172800 segundos, con un rango documentado de 3600 a 259200 segundos.

Seedance V1.5 Pro: texto a video vs imagen a video

Elige texto a video cuando la idea aún sea verbal. Si tu flujo de trabajo comienza con una línea de guion, dirección de cámara, descripción del sujeto o un brief creativo, T2V mantiene la primera pasada ligera. Es el modo más limpio para ideación, exploración de prompts y casos donde la identidad exacta del producto o personaje no es el criterio principal de aceptación.

Elige imagen a video cuando el primer visual importe. I2V es mejor para imágenes fijas de producto, fotogramas de diseño, referencias de personajes, miniaturas, paneles de storyboard y visuales controlados por la marca. No garantiza la preservación perfecta de la identidad en cada fotograma, pero le da a la generación un punto de partida concreto que T2V solo con prompt no tiene.

El campo adicional exclusivo de I2V es last_image. Úsalo cuando un clip necesita pasar de un fotograma de apertura conocido a un fotograma final conocido. Esto es útil para pruebas de transición, revelaciones cortas de producto, movimiento simple de antes y después, y escenas storyboardeadas donde la composición final ya está decidida. Cuando las relaciones de aspecto del primer y último fotograma difieren, los docs dicen que el último fotograma se recorta automáticamente para que coincida con el primero, por lo que los equipos deben preparar relaciones de aspecto coincidentes cuando el encuadre visual sea importante.

Para conceptos solo con prompt, T2V suele ser la primera prueba. Para conceptos basados en activos, I2V suele ser la primera prueba. Si ya conoces el fotograma de inicio, no obligues al modelo a redescubrirlo a partir del texto.

Audio de Seedance V1.5 Pro vs salida silenciosa

Seedance V1.5 Pro tiene un interruptor de audio directo a través de generate_audio. Cuando es true, el video generado incluye audio sincronizado, como habla generada automáticamente, efectos de sonido y música de fondo basados en el prompt y el contenido visual. Cuando es false, la salida es silenciosa.

El audio cambia la redacción del prompt. Si el habla generada es parte de la prueba, escribe la línea hablada explícitamente y sepárala de la acción visual y el sonido ambiental. Un prompt de escena vago puede ser suficiente para la exploración visual, pero generalmente no lo es para una revisión de audio confiable.

El audio también cambia el costo. Los datos actuales de la página de precios de Novita verificados el 22 de junio de 2026 muestran filas de audio al doble de las filas silenciosas correspondientes para Seedance V1.5 Pro T2V e I2V en 480P y 720P. Si tu producto agregará una voz en off, fondo musical o diseño de sonido en un pipeline separado, genera video silencioso para las primeras pasadas. Si el habla sincronizada o el audio de escena es parte del requisito real del producto, prueba el audio temprano porque afecta tanto los criterios de revisión como el presupuesto.

Seedance V1.5 Pro: procesamiento en línea vs lotes flex

El campo service_tier es la principal elección del nivel de procesamiento. Los docs de Seedance V1.5 Pro describen default como inferencia en línea con cuotas de RPM y concurrencia más bajas para escenarios sensibles al tiempo. Describen flex como inferencia fuera de línea con cuotas de TPD más altas al 50% del precio del modo en línea para escenarios insensibles a la latencia.

Para el diseño de aplicaciones, trata default como el carril interactivo y flex como el carril por lotes. Una herramienta creativa orientada al usuario donde alguien espera en la interfaz debería comenzar con default. Un barrido nocturno de prompts, evaluación creativa basada en conjuntos de datos, una gran cola de revisión interna o un lote de campaña no urgente pueden usar flex.

Esta distinción es independiente del patrón de API asíncrona. Ambos modos aún devuelven primero un ID de tarea. La diferencia es el nivel de procesamiento y el perfil de costo, no si la API es síncrona.

Resolución de Seedance V1.5 Pro: 480p vs 720p vs 1080p

Los docs actuales de Seedance V1.5 Pro enumeran 480p, 720p y 1080p como valores de resolution compatibles. Los datos actuales de la página de precios exponen filas de precios detalladas para Seedance V1.5 Pro T2V e I2V en 480P y 720P. Los mismos datos de página no expusieron una fila de precio correspondiente para Seedance V1.5 Pro 1080P en los datos verificados para esta revisión, por lo que los planes de presupuesto de producción deben verificar la página de precios en vivo o la consola antes de usar 1080p a escala.

Para la mayoría de los equipos, 480p es la configuración de exploración adecuada. Es suficiente para juzgar la dirección del prompt, el movimiento aproximado, si una referencia de imagen está ayudando y si el audio debe permanecer en el alcance. Regenera los candidatos finalistas en 720p cuando la revisión visual importe más que el costo de exploración.

Usa 1080p solo después de confirmar tanto la disponibilidad como la facturación para la forma exacta del trabajo que planeas ejecutar. El campo de la API lo admite, pero hacer presupuesto solo con las filas visibles de 480P y 720P sería incompleto.

Precios de Seedance V1.5 Pro por resolución, audio y lotes flex

Los datos actuales de la página de precios de Novita verificados el 22 de junio de 2026 enumeran los siguientes precios de Seedance V1.5 Pro tanto para texto a video como para imagen a video. Los mismos precios aparecen para las filas de I2V de primer fotograma y de primer y último fotograma.

Modo	Resolución	Salida	En línea, `default`	Lote flex, `flex`
T2V o I2V	480P	Silencioso	$0.012/s	$0.006/s
T2V o I2V	480P	Audio	$0.024/s	$0.012/s
T2V o I2V	720P	Silencioso	$0.026/s	$0.013/s
T2V o I2V	720P	Audio	$0.052/s	$0.026/s

Los multiplicadores de costo son la parte útil:

El audio cuesta el doble que la fila silenciosa correspondiente.
El lote flex cuesta la mitad de la fila en línea correspondiente.
720P cuesta un poco más del doble que la fila de 480P correspondiente.
T2V e I2V tienen la misma tarifa listada en la misma resolución, configuración de audio y nivel de servicio.

Para un clip de audio de 10 segundos en 720P, el costo en línea listado es 10 x $0.052, o $0.52. El mismo clip a través de flex es 10 x $0.026, o $0.26, cuando la latencia es aceptable. Para un clip de exploración silencioso de 10 segundos en 480P, el costo flex listado es 10 x $0.006, o $0.06.

Esto hace que la ruta de prueba temprana sea sencilla: reduce el costo desactivando el audio, usando 480P y usando flex cuando la revisión no necesite un resultado inmediato. Aumenta el costo solo cuando el clip esté lo suficientemente cerca como para evaluarlo con calidad final.

¿Qué modo de Seedance V1.5 Pro deberías probar primero?

Empieza con T2V cuando aún estés buscando la escena. Escribe de cinco a diez prompts compactos, mantén la duración lo suficientemente corta para la revisión, usa 480p y deja el audio apagado a menos que el habla sea la idea central. El objetivo es descubrir si el concepto funciona antes de introducir restricciones de activos.

Empieza con I2V cuando el activo ya sea el concepto. Si un fotograma de producto, referencia de personaje o composición aprobada es innegociable, usa esa imagen desde la primera prueba. Un prompt de T2V puede crear una escena plausible, pero no conocerá la imagen de referencia exacta a menos que la proporciones.

Empieza con I2V más last_image cuando la transición importe más que el movimiento abierto. Esta es la primera prueba adecuada para una composición de inicio y final conocidos. Mantén la primera y la última imagen con una relación de aspecto cercana y evita sobrecargar el prompt con demasiadas acciones no relacionadas.

Empieza en silencio a menos que el audio sea parte de la aceptación. Una vez que la dirección visual sea aceptable, habilita generate_audio si es necesario y escribe la línea hablada o la señal de sonido explícitamente.

Empieza con flex para colas y default para interfaces de usuario en vivo. Si la generación va a un pipeline de revisión en segundo plano, usa flex y gasta los ahorros en más variantes. Si un usuario está esperando en una superficie de producto, usa default y diseña la interfaz en torno al progreso de la tarea.

API de Seedance V1.5 Pro: flujo de trabajo completo en Novita AI

Un flujo de trabajo de producción debe tratar ambos modos de Seedance V1.5 Pro como trabajos asíncronos:

Elige T2V o I2V según si tienes una imagen de entrada.
Elige silencioso o audio con generate_audio.
Elige default o flex con service_tier.
Elige resolución y duración.
Envía la tarea al endpoint específico del modelo.
Almacena el ID de tarea devuelto.
Consulta la API de resultado de tarea hasta que la tarea tenga éxito o falle.
Almacena la URL del video devuelto antes de que caduque.

Aquí hay una forma mínima de solicitud de texto a video:

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-t2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "prompt": "Un clip de demostración de producto que muestra una lámpara inteligente compacta encendiéndose en un estudio limpio. Movimiento de cámara lento hacia adentro, sombras suaves, fondo neutro.",
    "duration": 5,
    "resolution": "480p",
    "ratio": "16:9",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

Aquí hay una forma mínima de solicitud de imagen a video:

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.png",
    "prompt": "Anima la lámpara con un pulso de luz suave mientras la cámara hace un movimiento sutil hacia adelante. Mantén el producto centrado y evita superposiciones de texto.",
    "duration": 5,
    "resolution": "480p",
    "ratio": "adaptive",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

Después del envío, usa el ID de tarea devuelto con la API de resultado de tarea. Construye para los estados en cola, procesando, exitoso y fallido en lugar de asumir que una URL de video estará disponible de inmediato.

Recomendación final para Seedance V1.5 Pro

Para la mayoría de los equipos, la mejor primera prueba de Seedance V1.5 Pro es 480P, silencioso y flex: T2V si solo tienes un concepto escrito, I2V si tienes una imagen de origen. Pasa a 720P después de que el prompt o la imagen de referencia estén cerca. Habilita el audio solo cuando el habla generada, los efectos de sonido o la música sean parte de la revisión. Usa default cuando el resultado esté orientado al usuario y sea sensible al tiempo; usa flex cuando la tarea pueda esperar.

Esa secuencia mantiene la primera evaluación barata sin cambiar el flujo central de la API. Una vez que un clip pase la revisión visual, aumenta la resolución, activa el audio si es necesario y ejecuta un conjunto más pequeño de candidatos finales.

Preguntas frecuentes

¿Seedance V1.5 Pro está disponible tanto para texto a video como para imagen a video en Novita AI?

Sí. Novita AI documenta endpoints separados de Seedance V1.5 Pro T2V e I2V: POST /v3/async/seedance-v1.5-pro-t2v y POST /v3/async/seedance-v1.5-pro-i2v.

¿Seedance V1.5 Pro genera audio?

Sí. El campo generate_audio controla si la salida incluye audio sincronizado. Configúralo como true para habla generada, efectos de sonido o música de fondo, y false para video silencioso.

¿Es imagen a video más caro que texto a video?

Los datos actuales de la página de precios verificados para este artículo enumeran las mismas tarifas de Seedance V1.5 Pro para T2V e I2V en la misma resolución, configuración de audio y nivel de servicio.

¿Cuál es la diferencia entre procesamiento en línea y flex?

Los docs describen default como inferencia en línea para escenarios sensibles al tiempo y flex como inferencia fuera de línea para escenarios insensibles a la latencia al 50% del precio del modo en línea.

¿Debería probar 480P o 720P primero?

Usa 480P para exploración amplia de prompts e imágenes de referencia. Usa 720P cuando el concepto esté lo suficientemente cerca para una revisión visual más seria. Verifica la facturación de 1080P antes de usarlo en una ejecución grande.

API de Seedance V1.5 Pro: Texto a Video vs Imagen a Video, Modos de Audio y Silencio

Tabla de selección rápida de Seedance V1.5 Pro

Modos de texto a video e imagen a video de Seedance V1.5 Pro en Novita AI

Seedance V1.5 Pro: texto a video vs imagen a video

Audio de Seedance V1.5 Pro vs salida silenciosa

Seedance V1.5 Pro: procesamiento en línea vs lotes flex

Resolución de Seedance V1.5 Pro: 480p vs 720p vs 1080p

Precios de Seedance V1.5 Pro por resolución, audio y lotes flex

¿Qué modo de Seedance V1.5 Pro deberías probar primero?

API de Seedance V1.5 Pro: flujo de trabajo completo en Novita AI

Recomendación final para Seedance V1.5 Pro

Preguntas frecuentes

¿Seedance V1.5 Pro está disponible tanto para texto a video como para imagen a video en Novita AI?

¿Seedance V1.5 Pro genera audio?

¿Es imagen a video más caro que texto a video?

¿Cuál es la diferencia entre procesamiento en línea y flex?

¿Debería probar 480P o 720P primero?

Artículos recomendados

Product

RESOURCES

Partners

Company

Tabla de selección rápida de Seedance V1.5 Pro

Modos de texto a video e imagen a video de Seedance V1.5 Pro en Novita AI

Seedance V1.5 Pro: texto a video vs imagen a video

Audio de Seedance V1.5 Pro vs salida silenciosa

Seedance V1.5 Pro: procesamiento en línea vs lotes flex

Resolución de Seedance V1.5 Pro: 480p vs 720p vs 1080p

Precios de Seedance V1.5 Pro por resolución, audio y lotes flex

¿Qué modo de Seedance V1.5 Pro deberías probar primero?

API de Seedance V1.5 Pro: flujo de trabajo completo en Novita AI

Recomendación final para Seedance V1.5 Pro

Preguntas frecuentes

¿Seedance V1.5 Pro está disponible tanto para texto a video como para imagen a video en Novita AI?

¿Seedance V1.5 Pro genera audio?

¿Es imagen a video más caro que texto a video?

¿Cuál es la diferencia entre procesamiento en línea y flex?

¿Debería probar 480P o 720P primero?

Artículos recomendados

Publicaciones relacionadas

Product

RESOURCES

Partners

Company