Vidu Q3 Pro vs Turbo sur Novita AI : Quel mode vidéo utiliser ?

Vidu Q3 Pro vs Turbo sur Novita AI : Quel mode vidéo utiliser ?

Choisissez d’abord Vidu Q3 Turbo lorsque vous avez besoin de coûts réduits, d’itérations rapides ou de tests vidéo à grand volume ; choisissez Vidu Q3 Pro lorsque vous êtes prêt à payer le prix plus élevé par seconde pour la variante Pro et que vous souhaitez la comparer à Turbo pour un rendu créatif final. Sur Novita AI, les deux variantes proposent des endpoints texte-vers-vidéo, image-vers-vidéo et début-fin-vers-vidéo, prennent en charge la génération asynchrone et utilisent le même modèle de tarification publique par seconde pour ces trois modes.

Résumé de la sélection entre Vidu Q3 Pro et Turbo

La différence la plus claire, basée sur les sources, entre Vidu Q3 Pro et Vidu Q3 Turbo sur Novita AI est la tarification. La grille tarifaire publique de Novita AI indique que Turbo a des tarifs par seconde inférieurs à ceux de Pro pour les résolutions 540p, 720p et 1080p. La documentation API montre également que les deux variantes sont disponibles via des endpoints asynchrones distincts pour texte-vers-vidéo, image-vers-vidéo et début-fin-vers-vidéo.

Point de décision Commencez par Vidu Q3 Turbo Commencez par Vidu Q3 Pro
Objectif principal Explorer des prompts, exécuter plus de variantes, réduire les dépenses par seconde Comparer la variante Pro pour les clips finaux candidats
Profil budgétaire Prix de pointe et hors pointe plus bas à chaque résolution listée Prix par seconde plus élevés à chaque résolution listée
Modes API sur Novita AI Texte-vers-vidéo, image-vers-vidéo, début-fin-vers-vidéo Texte-vers-vidéo, image-vers-vidéo, début-fin-vers-vidéo
Options de sortie dans la doc Jusqu’à 1080p ; 1 à 16 secondes Jusqu’à 1080p ; 1 à 16 secondes
Support audio dans la doc Les contrôles de génération audio-vidéo Q3 sont disponibles Les contrôles de génération audio-vidéo Q3 sont disponibles
Meilleur premier test Itération à grand volume, recherche de prompts, montages bruts, variantes pour les réseaux sociaux Passage de comparaison final après que Turbo ait réduit le prompt et le mode

Turbo et Pro sont mieux considérés comme deux options de tarification et de flux de travail plutôt que comme un simple classement bon contre mauvais. La documentation publique et les pages de tarification permettent une comparaison des coûts et des endpoints, mais elles ne publient pas de benchmark universel, de score de latence ou de classement de qualité de scène qui trancherait la question pour chaque prompt. Si le résultat compte vraiment, la manière la plus fiable de décider est d’exécuter le même prompt ou le même ensemble d’images avec les deux variantes et de comparer les résultats côte à côte.

Modes texte-vers-vidéo, image-vers-vidéo et début-fin de Vidu Q3

Vidu Q3 n’est pas une configuration unique. Sur Novita AI, le choix utile est bidimensionnel : choisissez Pro ou Turbo, puis choisissez le mode de génération qui correspond à votre matériau source.

Mode Ce que vous fournissez Utilisez-le lorsque Endpoint Pro Endpoint Turbo
Texte-vers-vidéo Un prompt textuel Vous explorez une nouvelle scène, un personnage, un mouvement de caméra, un concept publicitaire ou une idée de storyboard à partir de zéro /v3/async/vidu-q3-pro-t2v /v3/async/vidu-q3-turbo-t2v
Image-vers-vidéo Une image de référence plus un prompt de mouvement optionnel Vous avez déjà une image de produit, une image de personnage, une référence de style ou une composition fixe à animer /v3/async/vidu-q3-pro-i2v /v3/async/vidu-q3-turbo-i2v
Début-fin-vers-vidéo Deux images, une image de début et une image de fin Vous avez besoin que le modèle interpole entre une première et une dernière image connues /v3/async/vidu-q3-pro-f2v /v3/async/vidu-q3-turbo-f2v

Pour le texte-vers-vidéo, la documentation liste un prompt obligatoire, un booléen audio, duration, resolution, aspect_ratio, off_peak et des contrôles de filigrane. Le texte-vers-vidéo Pro accepte des prompts jusqu’à 2 000 caractères ; le texte-vers-vidéo Turbo accepte des prompts jusqu’à 5 000 caractères.

Pour l’image-vers-vidéo, la documentation exige un tableau images. L’image-vers-vidéo Pro prend actuellement en charge une seule image, avec les formats JPG, JPEG, PNG et WebP acceptés, une taille maximale de 50 Mo par image et un rapport hauteur/largeur entre 1:4 et 4:1. La documentation de l’image-vers-vidéo Pro liste audio comme un champ d’URL audio personnalisé pour la musique de fond. L’image-vers-vidéo Turbo utilise également un tableau d’images de référence, prend en charge les mêmes formats d’image listés et la limite de 50 Mo, et liste un booléen audio ainsi qu’une option audio_type : all, speech_only, ou sound_effect_only.

Pour le début-fin-vers-vidéo, la documentation Pro et Turbo exige exactement deux images : la première image est l’image de début et la seconde est l’image de fin. La documentation liste des durées de 1 à 16 secondes et des options de résolution 540p, 720p et 1080p. Utilisez ce mode lorsque l’endroit où une transition commence et se termine importe plus que la découverte d’une scène à partir d’un prompt vierge.

Tarification de Vidu Q3 Pro et Turbo

La tarification de Novita AI est listée par seconde pour Vidu Q3 Pro et Vidu Q3 Turbo. La tarification publique actuelle, vérifiée le 23 juin 2026, montre les mêmes tarifs pour le texte-vers-vidéo, l’image-vers-vidéo et le début-fin-vers-vidéo pour chaque variante et résolution.

Résolution Vidu Q3 Pro pointe Vidu Q3 Pro hors pointe Vidu Q3 Turbo pointe Vidu Q3 Turbo hors pointe
540p 0,0625 $/s 0,0313 $/s 0,0357 $/s 0,0179 $/s
720p 0,1339 $/s 0,0670 $/s 0,0536 $/s 0,0268 $/s
1080p 0,1429 $/s 0,0714 $/s 0,0714 $/s 0,0357 $/s

Voici ce que cela signifie pour des clips de test courants :

Clip de test Pro pointe Pro hors pointe Turbo pointe Turbo hors pointe
5 secondes en 540p 0,3125 $ 0,1565 $ 0,1785 $ 0,0895 $
10 secondes en 720p 1,3390 $ 0,6700 $ 0,5360 $ 0,2680 $
16 secondes en 1080p 2,2864 $ 1,1424 $ 1,1424 $ 0,5712 $

Le mode hors pointe est le plus judicieux lorsque les délais sont flexibles. La documentation de l’API Vidu Q3 décrit les tâches hors pointe comme des tâches à moindre coût traitées dans les 48 heures, ce qui peut bien fonctionner lorsque vous explorez des prompts et souhaitez un lot plus large de tests à moindre coût. Si vous construisez un flux destiné aux utilisateurs, le mode pointe reste le choix par défaut plus sûr, sauf si une livraison différée fait déjà partie de l’expérience produit.

Quel mode Vidu Q3 devriez-vous tester en premier ?

La manière la plus simple de choisir un mode est de commencer par l’entrée que vous possédez déjà. De nombreux tests décevants viennent du fait de choisir l’option la plus excitante en premier, plutôt que celle qui correspond le mieux au matériau disponible.

Situation Premier mode à tester Variante recommandée Pourquoi
Vous n’avez qu’une idée écrite Texte-vers-vidéo Turbo Cela vous permet d’explorer plus de directions de prompt à un coût par seconde inférieur.
Vous avez un rendu de produit ou une image de personnage Image-vers-vidéo Turbo d’abord, puis Pro pour les finalistes L’image de référence contraint la cible visuelle, et Turbo maintient l’itération moins chère.
Vous avez un storyboard avec une première et une dernière image connues Début-fin-vers-vidéo Turbo d’abord, puis Pro si nécessaire Les deux images donnent au modèle des points de terminaison explicites, ce qui est utile pour des transitions contrôlées.
Vous avez besoin d’un clip silencieux pour un montage ultérieur Texte-vers-vidéo ou image-vers-vidéo avec audio désactivé Turbo La documentation expose un contrôle audio, vous pouvez donc éviter de générer un audio que vous remplacerez.
Vous décidez entre des clips candidats finaux Même mode dans les deux variantes Pro et Turbo côte à côte Utilisez des entrées identiques et comparez les sorties pour votre scène au lieu de vous fier à des hypothèses génériques.

Si vous débutez avec Vidu Q3 sur Novita AI, voici généralement la manière la plus fluide de commencer :

  1. Exécutez Turbo texte-vers-vidéo en 540p ou 720p pour trouver la direction du prompt.
  2. Passez à l’image-vers-vidéo si vous avez besoin d’un contrôle d’identité, de produit ou de style visuel à partir d’une image fixe.
  3. Utilisez le début-fin-vers-vidéo uniquement lorsque vous avez une véritable première et dernière image.
  4. Réexécutez votre candidat le plus fort en Pro à la résolution cible avant de décider si le prix plus élevé est justifié pour cette scène.

Cette séquence maintient l’étape de comparaison la plus coûteuse proche de la décision finale, lorsque vous avez déjà une direction prometteuse. Elle vous aide également à éviter de dépenser le budget Pro dans une exploration précoce de prompts que vous pourriez finalement jeter.

Endpoints API Vidu Q3 et flux de requête

Les six endpoints Vidu Q3 dans cette comparaison utilisent le modèle de tâche asynchrone v3 de Novita AI. Vous soumettez une requête de génération, recevez un task_id, puis appelez l’API Task Result avec ce task_id pour récupérer la vidéo générée lorsque la tâche réussit.

Endpoint Méthode Modèle de résultat
/v3/async/vidu-q3-pro-t2v POST Retourne task_id
/v3/async/vidu-q3-pro-i2v POST Retourne task_id
/v3/async/vidu-q3-pro-f2v POST Retourne task_id
/v3/async/vidu-q3-turbo-t2v POST Retourne task_id
/v3/async/vidu-q3-turbo-i2v POST Retourne task_id
/v3/async/vidu-q3-turbo-f2v POST Retourne task_id
/v3/async/task-result GET Retourne le statut de la tâche et le média généré lorsqu’il est disponible

Une requête minimale Turbo texte-vers-vidéo ressemble à ceci :

curl --request POST \
  --url https://api.novita.ai/v3/async/vidu-q3-turbo-t2v \
  --header "Authorization: Bearer $NOVITA_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "prompt": "Une vidéo de lancement de produit en plan rapproché sur une table de studio propre, léger zoom avant de la caméra, mouvement subtil de l'éclairage",
    "duration": 5,
    "resolution": "720p",
    "aspect_ratio": "16:9",
    "audio": true,
    "off_peak": false
  }'

Ensuite, interrogez l’endpoint de résultat de tâche :

curl --request GET \
  --url "https://api.novita.ai/v3/async/task-result?task_id=$NOVITA_TASK_ID" \
  --header "Authorization: Bearer $NOVITA_API_KEY"

Pour l’image-vers-vidéo, remplacez l’endpoint par l’endpoint I2V et fournissez le tableau images. Pour le début-fin-vers-vidéo, utilisez l’endpoint F2V et fournissez deux images dans l’ordre : l’image de début en premier, l’image de fin en second.

Plan de test pratique pour Vidu Q3

Utilisez une petite matrice de test au lieu d’impressions uniques. L’objectif n’est pas de prouver un gagnant universel ; c’est de choisir la variante et le mode adaptés à votre cas d’utilisation.

Passage de test Variante Mode Résolution Ce qu’il faut évaluer
Recherche de prompt Turbo Texte-vers-vidéo 540p ou 720p Quelle structure de prompt donne la bonne scène, le bon mouvement et le bon cadrage ?
Contrôle de référence Turbo Image-vers-vidéo 720p Le modèle préserve-t-il suffisamment le sujet ou le produit pour votre cas d’utilisation ?
Contrôle de transition Turbo Début-fin-vers-vidéo 720p Le mouvement entre la première et la dernière image semble-t-il utilisable ?
Comparaison finale Turbo et Pro Même mode gagnant Résolution cible Le résultat Pro vaut-il le coût par seconde plus élevé pour cette scène ?
Passage coût Variante gagnante Même mode gagnant Résolution cible Cette exécution doit-elle être en pointe, ou peut-elle passer en hors pointe ?

Lorsque vous comparez Pro et Turbo, gardez ces variables identiques :

  • Même prompt, mêmes entrées d’images, même durée, même résolution et même rapport hauteur/largeur.
  • Même réglage audio.
  • Même réglage hors pointe lorsque vous comparez les résultats de sortie.
  • Mêmes critères d’évaluation : cohérence de l’identité, clarté du mouvement, mouvement de la caméra, utilité audio et éditabilité.

Si vous modifiez le prompt et la variante du modèle en même temps, la comparaison devient floue, car vous ne pouvez plus dire quel changement a réellement amélioré le résultat.

FAQ

Vidu Q3 Turbo est-il moins cher que Vidu Q3 Pro sur Novita AI ?

Oui. La tarification actuelle de Novita AI, vérifiée le 23 juin 2026, liste Turbo en dessous de Pro en 540p, 720p et 1080p pour texte-vers-vidéo, image-vers-vidéo et début-fin-vers-vidéo.

Vidu Q3 Pro et Turbo prennent-ils en charge les mêmes modes ?

La documentation de Novita AI liste des endpoints Pro et Turbo distincts pour texte-vers-vidéo, image-vers-vidéo et début-fin-vers-vidéo. Chaque endpoint retourne un task_id et utilise le flux de résultat de tâche asynchrone v3.

Dois-je utiliser d’abord le texte-vers-vidéo ou l’image-vers-vidéo ?

Utilisez d’abord le texte-vers-vidéo lorsque vous n’avez qu’une idée ou une scène écrite. Utilisez d’abord l’image-vers-vidéo lorsqu’une image de référence est importante, comme une photo de produit, une image de personnage ou un style visuel fixe.

Quand dois-je utiliser le début-fin-vers-vidéo ?

Utilisez le début-fin-vers-vidéo lorsque vous avez deux images et que vous avez besoin que le modèle crée le mouvement entre elles. C’est le plus structuré des trois modes car la première et la dernière image sont toutes deux spécifiées.

Vidu Q3 prend-il en charge les contrôles audio ?

Oui. La documentation de Vidu Q3 inclut des contrôles audio. Le texte-vers-vidéo et le début-fin-vers-vidéo exposent un booléen audio. L’image-vers-vidéo Pro liste audio comme un champ d’URL audio personnalisé pour la musique de fond, tandis que l’image-vers-vidéo Turbo liste un booléen audio plus des options audio_type pour all, speech_only et sound_effect_only.

Dois-je exécuter à la fois Vidu Q3 Turbo et Pro pour le même prompt ?

Exécutez Turbo en premier lorsque vous explorez des prompts, des références, des durées et des rapports hauteur/largeur. Si un résultat est proche de ce dont vous avez besoin, réexécutez la même configuration sur Pro afin que la comparaison isole la variante du modèle au lieu de mélanger les changements de prompt et d’entrée.

Articles recommandés