Vidu Q3 Pro désormais disponible sur Novita AI : génération de vidéos audio-visuelles natives

Vidu Q3 Pro désormais disponible sur Novita AI : génération de vidéos audio-visuelles natives

Vidu Q3 Pro, le dernier modèle de génération de vidéos IA de Shengshu Technology, est désormais disponible sur Novita AI. Ceci marque une étape importante dans la création de vidéos IA accessibles, combinant une génération audio-vidéo native avec des extraits d’une durée maximale de 16 secondes et une résolution 1080p, le tout via une API simple.

Si vous attendiez un modèle vidéo prêt pour la production qui ne nécessite pas de coller l’audio après coup sur des extraits muets, c’est celui-ci.

Qu’est-ce qui rend le Vidu Q3 différent ?

La plupart des générateurs de vidéos IA actuels produisent des vidéos muettes. L’audio, s’il est pris en charge, est ajouté en seconde intention, souvent désynchronisé des visuels. Le Vidu Q3 adopte une approche fondamentalement différente.

Génération audio-visuelle native

Le Vidu Q3 génère la vidéo et l’audio simultanément, pas séquentiellement. Cela signifie :

  • Dialogues, musique de fond et effets sonores sont créés en synchronisation avec les visuels
  • Correspondance du rythme des scènes : le tempo de l’audio s’aligne sur le mouvement à l’écran
  • Pas de travail de post-production de collage : ce que vous obtenez est une vidéo complète, prête à être publiée

Deux modes : Texte-vers-Vidéo et Image-vers-Vidéo

Novita AI propose désormais un accès API aux deux variantes du Vidu Q3 Pro :

1. Texte-vers-Vidéo (T2V)

Générez des vidéos complètes à partir de descriptions textuelles.

Spécifications clés :

  • Résolutions : 540p, 720p, 1080p
  • Durée : 1 à 16 secondes
  • Rapports d’aspect : 16:9, 9:16, 4:3, 3:4, 1:1
  • Audio : Dialogues synchronisés + effets sonores (optionnels)

👉 Vidu Q3 Pro T2V

2. Image-vers-Vidéo (I2V)

Animez des images statiques avec un mouvement naturel et une cohérence des sujets.

Spécifications clés :

  • Entrée : Image de référence unique (JPG, PNG, WEBP ; taille maximale 50 Mo)
  • Contrôle du mouvement : Décrivez le mouvement de caméra souhaité et la dynamique de la scène
  • Options de style : Général (réaliste) ou Anime
  • Audio personnalisé : Téléchargez votre propre musique de fond (MP3, WAV, M4A, FLAC)

👉 Vidu Q3 Pro I2V

Comparaison avec la concurrence

L’avantage distinctif du Vidu Q3 est l’intégration narrative. Alors que des modèles comme Kling 3.0 excellent dans le polish visuel et Sora 2 dans la simulation physique, le Vidu Q3 se concentre sur des extraits complets, prêts pour une narration :

Fonctionnalité Vidu Q3 Concurrents typiques
Génération audio-vidéo native ✅ Oui ❌ Audio ajouté séparément
Durée maximale par extrait 16 secondes 8 à 12 secondes
Effets sonores synchronisés ✅ Oui ⚠️ Limités ou manuels
Récit multi-plans (Smart Cuts) ✅ Oui ❌ Non

Essayez-le maintenant : Playground sans code

Vous voulez tester le Vidu Q3 avant de l’intégrer via l’API ? Utilisez le Multimodal Playground de Novita AI pour des expérimentations instantanées :

👉 Lancer le Vidu Q3 Playground

  • Aucun code requis
  • Ajustez les paramètres avec une interface visuelle
  • Générez des vidéos en quelques secondes
  • Parfait pour tester les prompts et évaluer la qualité

Aller au Playground

Vous pouvez essayer Vidu Q3 Pro sur le playground Novita sans coder

Comment utiliser Vidu Q3 Pro via l’API

Récupérez votre clé API

  1. Inscrivez-vous sur un compte Novita AI
  2. Récupérez votre clé API depuis le tableau de bord

Créez votre compte et récupérez votre clé API

Intégration API sur Novita AI

Les deux API du Vidu Q3 Pro sont asynchrones :

  1. Envoyez une demande de génération → recevez un task_id
  2. Interrogez l’API de résultat de tâche → récupérez la vidéo générée une fois prête

Intégration API sur Novita AI

Les deux API du Vidu Q3 Pro sont asynchrones :

  1. Envoyez une demande de génération → recevez un task_id
  2. Interrogez l’API de résultat de tâche → récupérez la vidéo générée une fois prête

Étape 1 : Envoyer une demande de génération de vidéo

Envoyez une demande pour lancer la génération de votre vidéo. Vous recevrez immédiatement un task_id.

  • Code Python
import requests

url = "https://api.novita.ai/v3/async/vidu-q3-pro-t2v"

payload = {
    "seed": 123,
    "audio": True,
    "prompt": "<string>",
    "wm_url": "<string>",
    "duration": 123,
    "off_peak": True,
    "watermark": True,
    "resolution": "<string>",
    "wm_position": 123,
    "aspect_ratio": "<string>"
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)
  • Code cURL
curl --request POST \
  --url https://api.novita.ai/v3/async/vidu-q3-pro-t2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "audio": true,
  "prompt": "<string>",
  "wm_url": "<string>",
  "duration": 123,
  "off_peak": true,
  "watermark": true,
  "resolution": "<string>",
  "wm_position": 123,
  "aspect_ratio": "<string>"
}
'

Étape 2 : Récupérez votre vidéo

Interrogez ensuite l’API de résultat de tâche en utilisant le task_id pour télécharger votre vidéo.

  • Code Python
import requests

url = "https://api.novita.ai/v3/async/task-result"

headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.get(url, headers=headers)

print(response.text)
  • Code cURL
curl --request GET \
  --url https://api.novita.ai/v3/async/task-result \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>'

Tarifs et optimisation

Modèle Période Résolution Prix
Vidu Q3 Pro Texte vers Vidéo Heures creuses 540P 0,0313 $ /s
Heures pleines 540P 0,0625 $ /s
Heures creuses 720P 0,067 $ /s
Heures pleines 720P 0,1339 $ /s
Heures creuses 1080P 0,0714 $ /s
Heures pleines 1080P 0,1429 $ /s
Vidu Q3 Pro Image vers Vidéo Heures creuses 540P 0,0313 $ /s
Heures pleines 540P 0,0625 $ /s
Heures creuses 720P 0,067 $ /s
Heures pleines 720P 0,1339 $ /s
Heures creuses 1080P 0,0714 $ /s
Heures pleines 1080P 0,1429 $ /s

🙌 Novita AI propose des tarifs heures creuses pour les workflows sensibles aux coûts :

  • Définissez "off_peak": true dans votre demande API
  • Les tâches sont mises en file d’attente pour être traitées dans un délai de 48 heures
  • Coût par génération réduit

Idéal pour le traitement par lots, la création de contenu planifiée à l’avance ou les projets non urgents.

Qui devrait utiliser Vidu Q3

Créateurs de contenu et marketeurs

  • Besoin de publicités vidéo ou de clips sociaux publiables rapidement
  • Veulent de l’audio intégré sans avoir à embaucher des ingénieurs du son

Équipes produit

  • Prototyper des fonctionnalités vidéo ou des démos
  • Générer du contenu placeholder pour des maquettes UX

Développeurs

  • Construire des applications centrées sur la vidéo (ex : avatars IA, outils éducatifs)
  • Besoin d’un accès programmatique à une génération de vidéos de haute qualité

Producteurs vidéo

  • Prévisualiser des scènes avant des tournages coûteux
  • Itérer rapidement sur des concepts de storyboard

Conclusion

Le Vidu Q3 Pro n’est pas qu’un autre modèle vidéo : c’est la première API largement accessible qui traite l’audio et la vidéo comme une sortie intégrée unique. Pour les workflows où la vitesse, la cohérence et la préparation à la production comptent, c’est une véritable avancée.

Que vous construisiez un pipeline de contenu alimenté par l’IA ou que vous soyez simplement fatigué de synchroniser manuellement l’audio sur des extraits muets, le Vidu Q3 sur Novita AI vaut la peine d’être testé.

Novita AI est une plateforme cloud IA qui offre aux développeurs un moyen simple de déployer des modèles IA via notre API simple, tout en fournissant un cloud GPU abordable et fiable pour construire et mettre à l’échelle.

Foire aux questions

Qui a développé le Vidu Q3 ?

Le Vidu Q3 est développé par Shengshu Technology, une entreprise IA spécialisée dans les modèles de génération de vidéos. L’entreprise a lancé le Vidu Q3 début 2026 dans le cadre de sa Semaine mondiale de la créativité, le positionnant comme un outil prêt pour la production dédié à la création de vidéos narratives.

Qu’est-ce qui rend le Vidu Q3 différent des autres modèles de vidéo IA ?

Le Vidu Q3 génère la vidéo et l’audio simultanément en une seule passe, pas en étapes séparées. Cela produit des dialogues, des effets sonores et une musique de fond naturellement synchronisés qui correspondent au rythme visuel, éliminant le besoin d’alignement audio en post-production.

Combien de temps faut-il pour générer une vidéo ?

Le temps de génération dépend de la durée et de la résolution de la vidéo. Le traitement typique va de 2 à 5 minutes pour les demandes standard. Utilisez l’option off_peak pour les projets non urgents : les vidéos sont traitées dans un délai de 48 heures à un coût réduit.