- Resumen de selección entre Vidu Q3 Pro y Turbo
- Modos de Vidu Q3: texto-a-video, imagen-a-video e inicio-fin
- Precios de Vidu Q3 Pro y Turbo
- ¿Qué modo de Vidu Q3 deberías probar primero?
- Endpoints de la API de Vidu Q3 y flujo de solicitud
- Plan de prueba práctico para Vidu Q3
- Preguntas frecuentes
- Artículos recomendados
Elige Vidu Q3 Turbo primero cuando necesites menor costo, iteración rápida o pruebas de video a gran volumen; elige Vidu Q3 Pro cuando estés dispuesto a pagar el precio por segundo más alto de la variante Pro y quieras compararlo con Turbo para un pase creativo final. En Novita AI, ambas variantes exponen endpoints de texto-a-video, imagen-a-video e inicio-fin-a-video, admiten generación asíncrona y utilizan el mismo patrón de precios público por segundo en estos tres modos.
Resumen de selección entre Vidu Q3 Pro y Turbo
La diferencia más clara respaldada por las fuentes entre Vidu Q3 Pro y Vidu Q3 Turbo en Novita AI es el precio. La carga útil de precios pública de Novita AI muestra a Turbo con tarifas por segundo más bajas que Pro para 540p, 720p y 1080p. La documentación de la API también indica que ambas variantes están disponibles a través de endpoints asíncronos separados para texto-a-video, imagen-a-video e inicio-fin-a-video.
| Punto de decisión | Comienza con Vidu Q3 Turbo | Comienza con Vidu Q3 Pro |
|---|---|---|
| Objetivo principal | Explorar prompts, ejecutar más variantes, reducir el gasto por segundo | Comparar la variante Pro para clips candidatos finales |
| Perfil de presupuesto | Precios pico y valle más bajos en cada resolución listada | Precios por segundo más altos en cada resolución listada |
| Modos de API en Novita AI | Texto-a-video, imagen-a-video, inicio-fin-a-video | Texto-a-video, imagen-a-video, inicio-fin-a-video |
| Opciones de salida en la documentación | Hasta 1080p; 1-16 segundos | Hasta 1080p; 1-16 segundos |
| Soporte de audio en la documentación | Los controles de generación de audio-video Q3 están disponibles | Los controles de generación de audio-video Q3 están disponibles |
| Mejor primera prueba | Iteración de alto volumen, búsqueda de prompts, cortes preliminares, variantes para redes sociales | Pase de comparación final después de que Turbo haya reducido el prompt y el modo |
Turbo y Pro se ven mejor como dos opciones de precio y flujo de trabajo que como una clasificación simple de bueno versus malo. La documentación pública y las páginas de precios respaldan una comparación de costos y endpoints, pero no publican un benchmark universal, una puntuación de latencia o una clasificación de calidad de escena que resuelva la pregunta para cada prompt. Si el resultado realmente importa, la forma más confiable de decidir es ejecutar el mismo prompt o conjunto de imágenes a través de ambas variantes y comparar los resultados lado a lado.
Modos de Vidu Q3: texto-a-video, imagen-a-video e inicio-fin
Vidu Q3 no es una configuración única. En Novita AI, la elección útil es bidimensional: elige Pro o Turbo, luego elige el modo de generación que coincida con tu material de origen.
| Modo | Qué proporcionas | Cuándo usarlo | Endpoint Pro | Endpoint Turbo |
|---|---|---|---|---|
| Texto-a-video | Un prompt de texto | Estás explorando una nueva escena, personaje, movimiento de cámara, concepto publicitario o idea de storyboard desde cero | /v3/async/vidu-q3-pro-t2v |
/v3/async/vidu-q3-turbo-t2v |
| Imagen-a-video | Una imagen de referencia más un prompt de movimiento opcional | Ya tienes una imagen de producto, fotograma de personaje, referencia de estilo o composición fija para animar | /v3/async/vidu-q3-pro-i2v |
/v3/async/vidu-q3-turbo-i2v |
| Inicio-fin-a-video | Dos imágenes, un fotograma de inicio y uno de fin | Necesitas que el modelo interpole entre un primer y último fotograma conocidos | /v3/async/vidu-q3-pro-f2v |
/v3/async/vidu-q3-turbo-f2v |
Para texto-a-video, la documentación lista un prompt obligatorio, un booleano audio, duration, resolution, aspect_ratio, off_peak y controles de marca de agua. Pro texto-a-video acepta prompts de hasta 2000 caracteres; Turbo texto-a-video acepta prompts de hasta 5000 caracteres.
Para imagen-a-video, la documentación requiere un array images. Pro imagen-a-video actualmente admite una sola imagen de entrada, con JPG, JPEG, PNG y WebP aceptados, un máximo de 50 MB por imagen y una relación de aspecto entre 1:4 y 4:1. La documentación de Pro imagen-a-video lista audio como un campo de URL de audio personalizado para música de fondo. Turbo imagen-a-video también utiliza un array de imágenes de referencia, admite los mismos formatos de imagen listados y el límite de 50 MB, y lista un booleano audio más una opción audio_type: all, speech_only o sound_effect_only.
Para inicio-fin-a-video, tanto la documentación de Pro como la de Turbo requieren exactamente dos imágenes: la primera imagen es el fotograma de inicio y la segunda es el fotograma de fin. La documentación lista opciones de duración de 1 a 16 segundos y resoluciones de 540p, 720p y 1080p. Usa este modo cuando te importe dónde comienza y termina una transición más que descubrir una escena desde un prompt en blanco.
Precios de Vidu Q3 Pro y Turbo
Los precios de Novita AI se listan por segundo para Vidu Q3 Pro y Vidu Q3 Turbo. Los precios públicos actuales verificados el 23 de junio de 2026 muestran las mismas tarifas en texto-a-video, imagen-a-video e inicio-fin-a-video para cada variante y resolución.
| Resolución | Vidu Q3 Pro pico | Vidu Q3 Pro valle | Vidu Q3 Turbo pico | Vidu Q3 Turbo valle |
|---|---|---|---|---|
| 540p | $0.0625/s | $0.0313/s | $0.0357/s | $0.0179/s |
| 720p | $0.1339/s | $0.0670/s | $0.0536/s | $0.0268/s |
| 1080p | $0.1429/s | $0.0714/s | $0.0714/s | $0.0357/s |
Esto es lo que significa para clips de prueba comunes:
| Clip de prueba | Pro pico | Pro valle | Turbo pico | Turbo valle |
|---|---|---|---|---|
| 5 segundos a 540p | $0.3125 | $0.1565 | $0.1785 | $0.0895 |
| 10 segundos a 720p | $1.3390 | $0.6700 | $0.5360 | $0.2680 |
| 16 segundos a 1080p | $2.2864 | $1.1424 | $1.1424 | $0.5712 |
El modo valle tiene más sentido cuando el tiempo de entrega es flexible. La documentación de la API de Vidu Q3 describe las tareas en valle como tareas de menor costo procesadas dentro de 48 horas, lo que puede funcionar bien cuando estás explorando prompts y deseas un lote más amplio de pruebas a un costo menor. Si estás construyendo un flujo orientado al usuario, el modo pico sigue siendo el valor predeterminado más seguro a menos que la entrega retrasada ya sea parte de la experiencia del producto.
¿Qué modo de Vidu Q3 deberías probar primero?
La forma más fácil de elegir un modo es comenzar con la entrada que ya tienes. Muchas pruebas decepcionantes provienen de elegir la opción más emocionante primero, en lugar de la que mejor se adapta al material disponible.
| Situación | Primer modo a probar | Variante recomendada | Por qué |
|---|---|---|---|
| Solo tienes una idea escrita | Texto-a-video | Turbo | Te permite explorar más direcciones de prompt a un costo por segundo más bajo. |
| Tienes un render de producto o un fotograma de personaje | Imagen-a-video | Turbo primero, luego Pro para finalistas | La imagen de referencia delimita el objetivo visual, y Turbo mantiene la iteración más barata. |
| Tienes un storyboard con un primer y último fotograma conocidos | Inicio-fin-a-video | Turbo primero, luego Pro si es necesario | Las dos imágenes le dan al modelo puntos finales explícitos, lo cual es útil para transiciones controladas. |
| Necesitas un clip sin audio para editar después | Texto-a-video o imagen-a-video con audio desactivado | Turbo | La documentación expone un control audio, por lo que puedes evitar generar audio que reemplazarás. |
| Estás decidiendo entre clips candidatos finales | Mismo modo en ambas variantes | Pro y Turbo lado a lado | Usa entradas idénticas y compara salidas para tu escena en lugar de confiar en suposiciones genéricas. |
Si eres nuevo en Vidu Q3 en Novita AI, esta suele ser la forma más fluida de comenzar:
- Ejecuta Turbo texto-a-video a 540p o 720p para encontrar la dirección del prompt.
- Pasa a imagen-a-video si necesitas control de identidad, producto o estilo visual a partir de una imagen fija.
- Usa inicio-fin-a-video solo cuando tengas un primer y último fotograma reales.
- Vuelve a ejecutar tu candidato más fuerte en Pro a la resolución objetivo antes de decidir si el precio más alto está justificado para esa escena.
Esa secuencia mantiene el paso de comparación más costoso cerca de la decisión final, cuando ya tienes una dirección prometedora. También te ayuda a evitar gastar el presupuesto de Pro en la exploración temprana de prompts que podrías terminar descartando de todos modos.
Endpoints de la API de Vidu Q3 y flujo de solicitud
Los seis endpoints de Vidu Q3 en esta comparación utilizan el patrón de tareas asíncronas v3 de Novita AI. Envías una solicitud de generación, recibes un task_id, luego llamas a la API de Resultado de Tarea con ese task_id para recuperar el video generado cuando la tarea se completa con éxito.
| Endpoint | Método | Patrón de resultado |
|---|---|---|
/v3/async/vidu-q3-pro-t2v |
POST |
Devuelve task_id |
/v3/async/vidu-q3-pro-i2v |
POST |
Devuelve task_id |
/v3/async/vidu-q3-pro-f2v |
POST |
Devuelve task_id |
/v3/async/vidu-q3-turbo-t2v |
POST |
Devuelve task_id |
/v3/async/vidu-q3-turbo-i2v |
POST |
Devuelve task_id |
/v3/async/vidu-q3-turbo-f2v |
POST |
Devuelve task_id |
/v3/async/task-result |
GET |
Devuelve el estado de la tarea y el contenido multimedia generado cuando esté disponible |
Una solicitud mínima de Turbo texto-a-video se ve así:
curl --request POST \
--url https://api.novita.ai/v3/async/vidu-q3-turbo-t2v \
--header "Authorization: Bearer $NOVITA_API_KEY" \
--header "Content-Type: application/json" \
--data '{
"prompt": "Un video de lanzamiento de producto en primer plano sobre una mesa de estudio limpia, suave acercamiento de cámara, movimiento de iluminación sutil",
"duration": 5,
"resolution": "720p",
"aspect_ratio": "16:9",
"audio": true,
"off_peak": false
}'
Luego consulta el endpoint de resultado de tarea:
curl --request GET \
--url "https://api.novita.ai/v3/async/task-result?task_id=$NOVITA_TASK_ID" \
--header "Authorization: Bearer $NOVITA_API_KEY"
Para imagen-a-video, reemplaza el endpoint con el endpoint I2V y proporciona el array images. Para inicio-fin-a-video, usa el endpoint F2V y proporciona dos imágenes en orden: primero el fotograma de inicio, luego el de fin.
Plan de prueba práctico para Vidu Q3
Usa una pequeña matriz de pruebas en lugar de impresiones únicas. El objetivo no es demostrar un ganador universal; es elegir la variante y el modo adecuados para tu caso de uso.
| Pase de prueba | Variante | Modo | Resolución | Qué evaluar |
|---|---|---|---|---|
| Búsqueda de prompt | Turbo | Texto-a-video | 540p o 720p | ¿Qué estructura de prompt da la escena, el movimiento y el encuadre correctos? |
| Control de referencia | Turbo | Imagen-a-video | 720p | ¿El modelo conserva el sujeto o producto lo suficiente para tu caso de uso? |
| Control de transición | Turbo | Inicio-fin-a-video | 720p | ¿El movimiento entre el primer y último fotograma se siente utilizable? |
| Comparación final | Turbo y Pro | Mismo modo ganador | Resolución objetivo | ¿El resultado de Pro vale el costo por segundo más alto para esta escena? |
| Pase de costo | Variante ganadora | Mismo modo ganador | Resolución objetivo | ¿Debería ejecutarse en pico o se puede mover a valle? |
Cuando compares Pro y Turbo, mantén iguales estas variables:
- Mismo prompt, entradas de imagen, duración, resolución y relación de aspecto.
- Misma configuración de audio.
- Misma configuración de valle cuando compares resultados de salida.
- Mismos criterios de evaluación: consistencia de identidad, claridad de movimiento, movimiento de cámara, utilidad del audio y editabilidad.
Si cambias el prompt y la variante del modelo al mismo tiempo, la comparación se vuelve confusa porque ya no puedes saber qué cambio mejoró realmente el resultado.
Preguntas frecuentes
¿Es Vidu Q3 Turbo más barato que Vidu Q3 Pro en Novita AI?
Sí. Los precios actuales de Novita AI verificados el 23 de junio de 2026 muestran a Turbo por debajo de Pro en 540p, 720p y 1080p para texto-a-video, imagen-a-video e inicio-fin-a-video.
¿Vidu Q3 Pro y Turbo admiten los mismos modos?
La documentación de Novita AI lista endpoints separados de Pro y Turbo para texto-a-video, imagen-a-video e inicio-fin-a-video. Cada endpoint devuelve un task_id y utiliza el flujo de resultado de tarea asíncrona v3.
¿Debería usar texto-a-video o imagen-a-video primero?
Usa texto-a-video primero cuando solo tengas una idea o escena escrita. Usa imagen-a-video primero cuando una imagen de referencia sea importante, como una foto de producto, fotograma de personaje o un estilo visual fijo.
¿Cuándo debería usar inicio-fin-a-video?
Usa inicio-fin-a-video cuando tengas dos fotogramas y necesites que el modelo cree el movimiento entre ellos. Es el más estructurado de los tres modos porque tanto el primer como el último fotograma están especificados.
¿Vidu Q3 admite controles de audio?
Sí. La documentación de Vidu Q3 incluye controles de audio. Texto-a-video e inicio-fin-a-video exponen un booleano audio. Pro imagen-a-video lista audio como un campo de URL de audio personalizado para música de fondo, mientras que Turbo imagen-a-video lista un booleano audio más opciones audio_type para all, speech_only y sound_effect_only.
¿Debería ejecutar tanto Vidu Q3 Turbo como Pro para el mismo prompt?
Ejecuta Turbo primero cuando estés explorando prompts, referencias, duraciones y relaciones de aspecto. Si un resultado se acerca a lo que necesitas, vuelve a ejecutar la misma configuración en Pro para que la comparación aísle la variante del modelo en lugar de mezclar cambios de prompt y entrada.
