Seedance V1.5 Pro en Novita AI: Texto a Video vs Imagen a Video, Modos con Audio y Silencio

Seedance V1.5 Pro en Novita AI: Texto a Video vs Imagen a Video, Modos con Audio y Silencio

Seedance V1.5 Pro en Novita AI es más fácil de elegir si comienzas por el activo que ya tienes: usa texto a video cuando la escena parte de un prompt, usa imagen a video cuando un primer fotograma o una configuración de primer y último fotograma deben guiar el resultado, mantén la salida silenciosa para iteración visual temprana, agrega audio solo cuando el diálogo, los efectos de sonido o la música formen parte de los criterios de aceptación, y usa el nivel de servicio flex para trabajos por lotes insensibles a la latencia.

Tabla de selección rápida de Seedance V1.5 Pro

Decisión Comienza aquí Por qué
Solo tienes una escena escrita Texto a video El endpoint de T2V requiere un prompt y puede elegir una relación de aspecto adaptativa a partir del prompt.
Tienes una foto de producto, un fotograma de personaje, un fotograma de storyboard o un visual aprobado Imagen a video El endpoint de I2V requiere image más prompt, por lo que el primer fotograma ancla el clip generado.
Necesitas un inicio y un final controlados Imagen a video con last_image La API de I2V admite last_image opcional para generación de primer y último fotograma.
Necesitas diálogo generado, efectos de sonido o música de fondo Establece generate_audio: true El audio se genera a partir del prompt y el contenido visual cuando está habilitado.
Agregarás tu propio audio después Establece generate_audio: false La salida silenciosa evita pagar por audio generado que descartarás.
Necesitas un resultado visible para el usuario más rápido Usa service_tier: "default" La documentación describe default como inferencia online para escenarios sensibles al tiempo.
Puedes esperar y quieres un costo unitario más bajo Usa service_tier: "flex" La documentación describe flex como inferencia offline al 50% del precio online.
Estás explorando prompts Empieza con 480p silencioso y flex cuando la latencia no sea importante Mantiene la exploración temprana más barata antes de regenerar los finalistas.
Estás revisando clips casi finales Pasa a 720p y activa el audio solo si forma parte de la aceptación 720p cuesta más que 480p, y el audio duplica la tarifa por segundo indicada.

Modos de Seedance V1.5 Pro disponibles en Novita AI

Novita AI expone Seedance V1.5 Pro a través de APIs de video asíncronas separadas:

Modo Ruta de API de Novita Entradas requeridas Entradas opcionales y controles
Seedance V1.5 Pro Texto a Video POST /v3/async/seedance-v1.5-pro-t2v prompt fps, seed, ratio, duration, watermark, resolution, camera_fixed, service_tier, generate_audio, execution_expires_after
Seedance V1.5 Pro Imagen a Video POST /v3/async/seedance-v1.5-pro-i2v image, prompt fps, seed, ratio, duration, watermark, last_image, resolution, camera_fixed, service_tier, generate_audio, execution_expires_after

Ambas APIs devuelven primero un ID de tarea, no un video terminado. Las aplicaciones deben llamar a la API de resultado de tarea de Novita AI para verificar el estado y recuperar los medios generados una vez que la tarea se complete.

Los controles compartidos de la solicitud importan para el diseño del producto. La documentación indica que duration toma un valor de 4 a 12 segundos, fps es 24, las opciones de ratio incluyen 16:9, 4:3, 1:1, 3:4, 9:16, 21:9 y adaptive, y las opciones de resolution son 480p, 720p y 1080p. El campo execution_expires_after tiene un valor predeterminado de 172800 segundos, con un rango documentado de 3600 a 259200 segundos.

Seedance V1.5 Pro: Texto a Video vs Imagen a Video

Elige texto a video cuando la idea aún sea verbal. Si tu flujo de trabajo comienza con una línea de guion, dirección de cámara, descripción del sujeto o un brief creativo, T2V mantiene ligera la primera pasada. Es el modo más limpio para ideación, exploración de prompts y casos donde la identidad exacta del producto o personaje no es el criterio principal de aceptación.

Elige imagen a video cuando el primer visual importe. I2V es mejor para fotos de producto, fotogramas de diseño, referencias de personajes, miniaturas, paneles de storyboard y visuales controlados por la marca. No garantiza una preservación perfecta de la identidad en cada fotograma, pero le da a la generación un punto de partida concreto que T2V con solo texto no tiene.

El campo adicional exclusivo de I2V es last_image. Úsalo cuando un clip necesite moverse desde un fotograma de inicio conocido hacia un fotograma final conocido. Esto es útil para pruebas de transición, revelaciones breves de producto, movimientos simples de antes y después, y escenas storyboardeadas donde la composición final ya está decidida. Cuando las relaciones de aspecto del primer y último fotograma difieren, la documentación indica que el último fotograma se recorta automáticamente para coincidir con el primero, por lo que los equipos deben preparar relaciones de aspecto coincidentes cuando el encuadre visual sea importante.

Para conceptos basados solo en texto, T2V suele ser la primera prueba. Para conceptos basados en activos visuales, I2V suele ser la primera prueba. Si ya conoces el fotograma inicial, no obligues al modelo a redescubrirlo a partir del texto.

Seedance V1.5 Pro: Audio vs Salida Silenciosa

Seedance V1.5 Pro tiene un interruptor de audio directo mediante generate_audio. Cuando es true, el video generado incluye audio sincronizado, como diálogo, efectos de sonido y música de fondo generados automáticamente a partir del prompt y el contenido visual. Cuando es false, la salida es silenciosa.

El audio cambia la redacción del prompt. Si el diálogo generado forma parte de la prueba, escribe la línea hablada explícitamente y sepárala de la acción visual y el sonido ambiental. Un prompt de escena vago puede ser suficiente para la exploración visual, pero generalmente no es suficiente para una revisión fiable del audio.

El audio también cambia el costo. Los datos actuales de la página de precios de Novita, verificados el 22 de junio de 2026, indican filas de audio al doble del precio de las filas silenciosas correspondientes para Seedance V1.5 Pro T2V e I2V en 480P y 720P. Si tu producto agregará una voz en off, una banda sonora o un diseño de sonido en un pipeline separado, genera video silencioso para las primeras pasadas. Si el diálogo sincronizado o el audio de escena forman parte del requisito real del producto, prueba el audio temprano porque afecta tanto los criterios de revisión como el presupuesto.

Seedance V1.5 Pro: Online vs Procesamiento por Lotes Flex

El campo service_tier es la principal elección del nivel de procesamiento. La documentación de Seedance V1.5 Pro describe default como inferencia online con cuotas de RPM y concurrencia más bajas para escenarios sensibles al tiempo. Describe flex como inferencia offline con cuotas de TPD más altas al 50% del precio online para escenarios insensibles a la latencia.

Para el diseño de aplicaciones, trata default como el carril interactivo y flex como el carril por lotes. Una herramienta creativa orientada al usuario donde alguien espera en la interfaz debe comenzar con default. Un barrido nocturno de prompts, una evaluación creativa tipo dataset, una gran cola de revisión interna o un lote de campaña no urgente pueden usar flex.

Esta distinción es independiente del patrón de API asíncrona. Ambos modos siguen devolviendo primero un ID de tarea. La diferencia es el nivel de procesamiento y el perfil de costo, no si la API es síncrona.

Seedance V1.5 Pro: Resolución 480p vs 720p vs 1080p

La documentación actual de Seedance V1.5 Pro enumera 480p, 720p y 1080p como valores de resolution soportados. La página de precios actual expone filas de precios detalladas para 480P y 720P de Seedance V1.5 Pro T2V e I2V. Los mismos datos no exponían una fila de precio coincidente para Seedance V1.5 Pro 1080P en los datos verificados para esta revisión, por lo que los planes de presupuesto de producción deben verificar la página de precios en vivo o la consola antes de usar 1080p a escala.

Para la mayoría de los equipos, 480p es la configuración de exploración adecuada. Es suficiente para juzgar la dirección del prompt, el movimiento aproximado, si una referencia de imagen está ayudando y si el audio debe mantenerse en el alcance. Regenera los candidatos finalistas en 720p cuando la revisión visual importe más que el costo de exploración.

Usa 1080p solo después de confirmar tanto la disponibilidad como la facturación para la forma exacta del trabajo que planeas ejecutar. El campo de la API lo soporta, pero presupuestar solo a partir de las filas visibles de 480P y 720P sería incompleto.

Precios de Seedance V1.5 Pro por Resolución, Audio y Lote Flex

Los datos actuales de la página de precios de Novita, verificados el 22 de junio de 2026, muestran los siguientes precios de Seedance V1.5 Pro tanto para texto a video como para imagen a video. Los mismos precios aparecen para las filas de I2V de primer fotograma y de primer y último fotograma.

Modo Resolución Salida Online, default Lote flex, flex
T2V o I2V 480P Silenciosa $0.012/s $0.006/s
T2V o I2V 480P Con audio $0.024/s $0.012/s
T2V o I2V 720P Silenciosa $0.026/s $0.013/s
T2V o I2V 720P Con audio $0.052/s $0.026/s

Los multiplicadores de costo son la parte útil:

  • El audio cuesta el doble que la fila silenciosa correspondiente.
  • El lote flex cuesta la mitad que la fila online correspondiente.
  • 720P cuesta un poco más del doble que la fila 480P correspondiente.
  • T2V e I2V tienen la misma tarifa indicada para la misma resolución, configuración de audio y nivel de servicio.

Para un clip de 10 segundos en 720P con audio, el costo online indicado es 10 x $0.052, es decir, $0.52. El mismo clip a través de flex es 10 x $0.026, o $0.26, cuando la latencia es aceptable. Para un clip de exploración silencioso de 10 segundos en 480P, el costo flex indicado es 10 x $0.006, o $0.06.

Esto hace que la ruta de pruebas tempranas sea directa: reduce el costo desactivando el audio, usando 480P y usando flex cuando la revisión no requiera un resultado inmediato. Aumenta el costo solo cuando el clip esté lo suficientemente cerca para evaluarlo con calidad final.

¿Qué modo de Seedance V1.5 Pro deberías probar primero?

Comienza con T2V cuando aún estés buscando la escena. Escribe de cinco a diez prompts compactos, mantén la duración lo suficientemente corta para revisar, usa 480p y deja el audio apagado a menos que el diálogo sea la idea central. El objetivo es descubrir si el concepto funciona antes de introducir restricciones de activos.

Comienza con I2V cuando el activo ya sea el concepto. Si un fotograma de producto, una referencia de personaje o una composición aprobada no son negociables, usa esa imagen desde la primera prueba. Un prompt de T2V puede crear una escena plausible, pero no conocerá la imagen de referencia exacta a menos que la proporciones.

Comienza con I2V más last_image cuando la transición importe más que el movimiento abierto. Esta es la primera prueba adecuada para una composición de inicio y final conocidos. Mantén la primera y la última imagen con una relación de aspecto cercana y evita sobrecargar el prompt con demasiadas acciones no relacionadas.

Comienza en silencio a menos que el audio sea parte de la aceptación. Una vez que la dirección visual sea aceptable, habilita generate_audio si es necesario y escribe la línea hablada o la señal de sonido explícitamente.

Comienza con flex para colas y default para interfaces en vivo. Si la generación irá a un pipeline de revisión en segundo plano, usa flex y gasta los ahorros en más variantes. Si un usuario está esperando en una superficie de producto, usa default y diseña la interfaz en torno al progreso de la tarea.

Flujo de trabajo de la API de Seedance V1.5 Pro en Novita AI

Un flujo de trabajo de producción debe tratar ambos modos de Seedance V1.5 Pro como trabajos asíncronos:

  1. Elige T2V o I2V según si tienes una imagen de entrada.
  2. Elige silencioso o con audio con generate_audio.
  3. Elige default o flex con service_tier.
  4. Elige resolución y duración.
  5. Envía la tarea al endpoint específico del modelo.
  6. Almacena el ID de tarea devuelto.
  7. Consulta la API de resultado de tarea hasta que la tarea tenga éxito o falle.
  8. Almacena la URL del video devuelto antes de que expire.

Aquí hay un ejemplo mínimo de solicitud de texto a video:

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-t2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "prompt": "Un clip de demostración de producto que muestra una lámpara inteligente compacta encendiéndose en un estudio limpio. Movimiento lento de cámara hacia adelante, sombras suaves, fondo neutro.",
    "duration": 5,
    "resolution": "480p",
    "ratio": "16:9",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

Aquí hay un ejemplo mínimo de solicitud de imagen a video:

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.png",
    "prompt": "Anima la lámpara con un suave pulso de luz mientras la cámara hace un movimiento sutil hacia adelante. Mantén el producto centrado y evita superposiciones de texto.",
    "duration": 5,
    "resolution": "480p",
    "ratio": "adaptive",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

Después del envío, usa el ID de tarea devuelto con la API de resultado de tarea. Diseña para los estados en cola, procesando, exitoso y fallido en lugar de asumir que una URL de video estará disponible de inmediato.

Recomendación final para Seedance V1.5 Pro

Para la mayoría de los equipos, la mejor primera prueba de Seedance V1.5 Pro es 480P, silencioso y flex: T2V si solo tienes un concepto escrito, I2V si tienes una imagen de origen. Pasa a 720P después de que el prompt o la imagen de referencia estén cerca. Habilita el audio solo cuando el diálogo, los efectos de sonido o la música generados formen parte de la revisión. Usa default cuando el resultado sea orientado al usuario y sensible al tiempo; usa flex cuando la tarea pueda esperar.

Esa secuencia mantiene la primera evaluación económica sin cambiar el flujo central de la API. Una vez que un clip supere la revisión visual, aumenta la resolución, activa el audio si es necesario y ejecuta un conjunto más pequeño de candidatos finales.

Preguntas frecuentes

¿Seedance V1.5 Pro está disponible tanto para texto a video como para imagen a video en Novita AI?

Sí. Novita AI documenta endpoints separados de Seedance V1.5 Pro T2V e I2V: POST /v3/async/seedance-v1.5-pro-t2v y POST /v3/async/seedance-v1.5-pro-i2v.

¿Seedance V1.5 Pro genera audio?

Sí. El campo generate_audio controla si la salida incluye audio sincronizado. Ajústalo a true para diálogo, efectos de sonido o música de fondo generados, y a false para video silencioso.

¿Imagen a video es más caro que texto a video?

Los datos actuales de la página de precios verificados para este artículo muestran las mismas tarifas de Seedance V1.5 Pro para T2V e I2V con la misma resolución, configuración de audio y nivel de servicio.

¿Cuál es la diferencia entre procesamiento online y flex?

La documentación describe default como inferencia online para escenarios sensibles al tiempo y flex como inferencia offline para escenarios insensibles a la latencia al 50% del precio online.

¿Debería probar 480P o 720P primero?

Usa 480P para una exploración amplia de prompts e imágenes de referencia. Usa 720P cuando el concepto esté lo suficientemente cerca para una revisión visual más seria. Verifica la facturación de 1080P antes de usarlo en una ejecución grande.

Artículos recomendados