Seedance V1.5 Pro sur Novita AI : text-to-video vs image-to-video, audio et modes silencieux

Seedance V1.5 Pro sur Novita AI : text-to-video vs image-to-video, audio et modes silencieux

Le choix de Seedance V1.5 Pro sur Novita AI est plus simple en partant de l’actif que vous possédez déjà : utilisez text-to-video lorsque la scène démarre d’une invite, utilisez image-to-video lorsqu’une première image (ou une configuration première-et-dernière image) doit guider le résultat, gardez la sortie silencieuse pour les itérations visuelles précoces, n’ajoutez l’audio que lorsque la parole, les effets sonores ou la musique font partie des critères d’acceptation, et utilisez le niveau de service flex pour le travail par lot insensible à la latence.

Tableau de sélection rapide Seedance V1.5 Pro

Décision Commencez ici Pourquoi
Vous n’avez qu’une scène rédigée Text-to-video L’endpoint T2V nécessite un prompt et peut choisir un rapport hauteur/largeur adaptatif à partir de l’invite.
Vous avez une photo produit, une image de personnage, une image de storyboard ou un visuel approuvé Image-to-video L’endpoint I2V nécessite image plus prompt, donc la première image ancre le clip généré.
Vous avez besoin d’un début et d’une fin contrôlés Image-to-video avec last_image L’API I2V prend en charge le paramètre optionnel last_image pour la génération première-et-dernière image.
Vous avez besoin de parole générée, d’effets sonores ou de musique de fond Définissez generate_audio: true L’audio est généré à partir de l’invite et du contenu visuel lorsqu’il est activé.
Vous ajouterez votre propre audio plus tard Définissez generate_audio: false La sortie silencieuse évite de payer pour un audio généré que vous allez jeter.
Vous avez besoin d’un résultat plus rapide pour l’utilisateur final Utilisez service_tier: "default" La documentation décrit default comme inférence en ligne pour les scénarios sensibles au temps.
Vous pouvez attendre et souhaitez un coût unitaire plus bas Utilisez service_tier: "flex" La documentation décrit flex comme inférence hors ligne à 50 % du prix du mode en ligne.
Vous explorez des prompts Commencez en 480p silencieux flex lorsque la latence n’est pas importante Cela rend l’exploration précoce moins chère avant de régénérer les finalistes.
Vous examinez des clips quasi finaux Passez en 720p et activez l’audio uniquement s’il fait partie des critères d’acceptation Le 720p coûte plus cher que le 480p, et l’audio double le taux par seconde indiqué.

Modes Seedance V1.5 Pro disponibles sur Novita AI

Novita AI expose Seedance V1.5 Pro via des API vidéo asynchrones distinctes :

Mode Chemin API Novita Entrées requises Entrées et contrôles optionnels
Seedance V1.5 Pro Text to Video POST /v3/async/seedance-v1.5-pro-t2v prompt fps, seed, ratio, duration, watermark, resolution, camera_fixed, service_tier, generate_audio, execution_expires_after
Seedance V1.5 Pro Image to Video POST /v3/async/seedance-v1.5-pro-i2v image, prompt fps, seed, ratio, duration, watermark, last_image, resolution, camera_fixed, service_tier, generate_audio, execution_expires_after

Les deux API retournent d’abord un ID de tâche, pas une vidéo terminée. Les applications doivent appeler l’API de résultat de tâche Novita AI pour vérifier l’état et récupérer le média généré après l’achèvement de la tâche.

Les contrôles partagés de la requête sont importants pour la conception produit. La documentation liste duration comme une valeur de 4 à 12 secondes, fps à 24, les options ratio incluant 16:9, 4:3, 1:1, 3:4, 9:16, 21:9 et adaptive, et les options resolution 480p, 720p et 1080p. Le champ execution_expires_after par défaut est de 172800 secondes, avec une plage documentée de 3600 à 259200 secondes.

Seedance V1.5 Pro Text-to-Video vs Image-to-Video

Choisissez text-to-video lorsque l’idée est encore verbale. Si votre flux de travail commence par une ligne de script, une direction de caméra, une description de sujet ou un brief créatif, le T2V allège le premier passage. C’est le mode le plus simple pour l’idéation, l’exploration de prompts et les cas où l’identité exacte du produit ou du personnage n’est pas le critère d’acceptation principal.

Choisissez image-to-video lorsque le premier visuel compte. L’I2V est meilleur pour les photos produit, les images de design, les références de personnages, les vignettes, les planches de storyboard et les visuels sous contrôle de marque. Il ne garantit pas une préservation parfaite de l’identité dans chaque image, mais il donne à la génération un point de départ concret que le T2V par prompt seul n’a pas.

Le champ supplémentaire propre à l’I2V est last_image. Utilisez-le lorsqu’un clip doit passer d’une image de départ connue à une image de fin connue. Cela est utile pour les tests de transition, les révélations courtes de produits, les mouvements simples avant-après et les scènes storyboardées où la composition finale est déjà décidée. Lorsque les rapports hauteur/largeur de la première et de la dernière image diffèrent, la documentation précise que la dernière image est automatiquement recadrée pour correspondre à la première, donc les équipes doivent préparer des rapports hauteur/largeur correspondants lorsque le cadrage visuel est important.

Pour les concepts basés uniquement sur un prompt, le T2V est généralement le premier test. Pour les concepts dirigés par un actif, l’I2V est généralement le premier test. Si vous connaissez déjà l’image de départ, ne forcez pas le modèle à la redécouvrir à partir du texte.

Seedance V1.5 Pro Audio vs Sortie silencieuse

Seedance V1.5 Pro dispose d’un interrupteur audio direct via generate_audio. Lorsqu’il est true, la vidéo générée inclut un audio synchronisé tel que la parole générée automatiquement, des effets sonores et une musique de fond basés sur l’invite et le contenu visuel. Lorsqu’il est false, la sortie est silencieuse.

L’audio modifie la rédaction des prompts. Si la parole générée fait partie du test, écrivez la ligne parlée explicitement et séparez-la de l’action visuelle et du son ambiant. Une invite de scène vague peut suffire pour l’exploration visuelle, mais elle n’est généralement pas suffisante pour une évaluation audio fiable.

L’audio modifie également le coût. Les données actuelles de la page de prix Novita vérifiées le 22 juin 2026 listent les lignes audio à deux fois le prix des lignes silencieuses correspondantes pour Seedance V1.5 Pro T2V et I2V en 480P et 720P. Si votre produit ajoutera une voix off, un fond musical ou une conception sonore dans un pipeline séparé, générez une vidéo silencieuse pour les premiers passages. Si la parole synchronisée ou l’audio de scène fait partie des exigences réelles du produit, testez l’audio tôt car il affecte à la fois les critères d’examen et le budget.

Seedance V1.5 Pro En ligne vs Traitement par lots Flex

Le champ service_tier est le principal choix de niveau de traitement. La documentation de Seedance V1.5 Pro décrit default comme inférence en ligne avec des quotas RPM et de concurrence plus faibles pour les scénarios sensibles au temps. Elle décrit flex comme inférence hors ligne avec des quotas TPD plus élevés à 50 % du prix du mode en ligne pour les scénarios insensibles à la latence.

Pour la conception d’application, traitez default comme la voie interactive et flex comme la voie batch. Un outil créatif destiné à l’utilisateur où quelqu’un attend dans l’interface utilisateur devrait démarrer avec default. Un balayage nocturne de prompts, une évaluation créative de type jeu de données, une grande file d’attente de révision interne ou un lot de campagne non urgent peuvent utiliser flex.

Cette distinction est distincte du modèle d’API asynchrone. Les deux modes retournent toujours un ID de tâche en premier. La différence réside dans le niveau de traitement et le profil de coût, pas dans le fait que l’API soit synchrone ou non.

Résolution Seedance V1.5 Pro : 480p vs 720p vs 1080p

La documentation actuelle de Seedance V1.5 Pro liste 480p, 720p et 1080p comme valeurs resolution prises en charge. La page de prix actuelle expose des lignes de prix détaillées 480P et 720P pour Seedance V1.5 Pro T2V et I2V. Les mêmes données de page n’exposaient pas de ligne de prix Seedance V1.5 Pro 1080P correspondante dans les données vérifiées pour cette révision, donc les plans budgétaires de production devraient vérifier la page de prix en direct ou la console avant d’utiliser le 1080p à grande échelle.

Pour la plupart des équipes, le 480p est le bon réglage d’exploration. Il suffit pour juger la direction du prompt, le mouvement approximatif, si une référence d’image est utile et si l’audio doit rester dans le périmètre. Régénérez les candidats finalistes en 720p lorsque l’examen visuel est plus important que le coût d’exploration.

Utilisez le 1080p uniquement après avoir confirmé à la fois la disponibilité et la facturation pour la forme exacte de travail que vous prévoyez d’exécuter. Le champ API le prend en charge, mais budgéter uniquement à partir des lignes visibles 480P et 720P serait incomplet.

Tarification Seedance V1.5 Pro par résolution, audio et lots Flex

Les données actuelles de la page de prix Novita vérifiées le 22 juin 2026 listent les prix Seedance V1.5 Pro suivants pour text-to-video et image-to-video. Les mêmes prix apparaissent pour les lignes I2V première image et I2V première-et-dernière image.

Mode Résolution Sortie En ligne, default Lots flex, flex
T2V ou I2V 480P Silencieux 0,012 $/s 0,006 $/s
T2V ou I2V 480P Audio 0,024 $/s 0,012 $/s
T2V ou I2V 720P Silencieux 0,026 $/s 0,013 $/s
T2V ou I2V 720P Audio 0,052 $/s 0,026 $/s

Les multiplicateurs de coût sont la partie utile :

  • L’audio coûte deux fois la ligne silencieuse correspondante.
  • Les lots flex coûtent la moitié de la ligne en ligne correspondante.
  • Le 720P coûte un peu plus du double de la ligne 480P correspondante.
  • Le T2V et l’I2V ont le même taux indiqué à la même résolution, réglage audio et niveau de service.

Pour un clip audio de 10 secondes en 720P, le coût en ligne indiqué est de 10 x 0,052 $, soit 0,52 $. Le même clip via flex est de 10 x 0,026 $, soit 0,26 $, lorsque la latence est acceptable. Pour un clip d’exploration silencieux de 10 secondes en 480P, le coût flex indiqué est de 10 x 0,006 $, soit 0,06 $.

Cela rend la voie de test précoce simple : réduisez le coût en désactivant l’audio, en utilisant le 480P et en utilisant flex lorsque l’examen n’a pas besoin d’un résultat immédiat. N’augmentez le coût que lorsque le clip est suffisamment proche pour être évalué à la qualité finale.

Quel mode Seedance V1.5 Pro devriez-vous tester en premier ?

Commencez par le T2V lorsque vous cherchez encore la scène. Rédigez cinq à dix prompts compacts, gardez la durée suffisamment courte pour l’examen, utilisez le 480p et laissez l’audio désactivé sauf si la parole est l’idée centrale. L’objectif est de découvrir si le concept fonctionne avant d’introduire des contraintes d’actifs.

Commencez par l’I2V lorsque l’actif est déjà le concept. Si une image produit, une référence de personnage ou une composition approuvée est non négociable, utilisez cette image dès le premier test. Un prompt T2V peut créer une scène plausible, mais il ne connaîtra pas l’image de référence exacte à moins que vous ne la fournissiez.

Commencez par l’I2V avec last_image lorsque la transition est plus importante qu’un mouvement libre. C’est le bon premier test pour une composition de début et de fin connues. Gardez les première et dernière images proches en rapport hauteur/largeur et évitez de surcharger l’invite avec trop d’actions sans rapport.

Commencez en mode silencieux sauf si l’audio fait partie des critères d’acceptation. Une fois la direction visuelle acceptable, activez generate_audio si nécessaire et rédigez explicitement la ligne parlée ou l’indice sonore.

Commencez avec flex pour les files d’attente et default pour l’interface utilisateur en direct. Si la génération va dans un pipeline de révision en arrière-plan, utilisez flex et dépensez les économies sur plus de variantes. Si un utilisateur attend dans une interface produit, utilisez default et concevez l’interface utilisateur autour de la progression de la tâche.

Workflow API Seedance V1.5 Pro sur Novita AI

Un workflow de production devrait traiter les deux modes Seedance V1.5 Pro comme des tâches asynchrones :

  1. Choisissez T2V ou I2V selon que vous ayez une image d’entrée.
  2. Choisissez silencieux ou audio avec generate_audio.
  3. Choisissez default ou flex avec service_tier.
  4. Choisissez la résolution et la durée.
  5. Soumettez la tâche à l’endpoint spécifique au modèle.
  6. Stockez l’ID de tâche retourné.
  7. Interrogez l’API de résultat de tâche jusqu’à ce que la tâche réussisse ou échoue.
  8. Stockez l’URL vidéo retournée avant son expiration.

Voici une forme minimale de requête text-to-video :

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-t2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "prompt": "Un clip de démonstration produit montrant une lampe intelligente compacte qui s\'allume dans un studio propre. Mouvement de caméra lent en push-in, ombres douces, fond neutre.",
    "duration": 5,
    "resolution": "480p",
    "ratio": "16:9",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

Voici une forme minimale de requête image-to-video :

curl --location --request POST 'https://api.novita.ai/v3/async/seedance-v1.5-pro-i2v' \
  --header 'Content-Type: application/json' \
  --header "Authorization: Bearer ${NOVITA_API_KEY}" \
  --data-raw '{
    "image": "https://example.com/product-frame.png",
    "prompt": "Animez la lampe avec une douce pulsation lumineuse tandis que la caméra effectue un mouvement subtil vers l\'avant. Gardez le produit centré et évitez les superpositions de texte.",
    "duration": 5,
    "resolution": "480p",
    "ratio": "adaptive",
    "service_tier": "flex",
    "generate_audio": false,
    "watermark": false
  }'

Après soumission, utilisez l’ID de tâche retourné avec l’API de résultat de tâche. Construisez pour les états en file d’attente, en traitement, réussi et échoué au lieu de supposer qu’une URL vidéo sera disponible immédiatement.

Recommandation finale pour Seedance V1.5 Pro

Pour la plupart des équipes, le meilleur premier test Seedance V1.5 Pro est en 480P, silencieux et flex : T2V si vous n’avez qu’un concept écrit, I2V si vous avez une image source. Passez en 720P après que le prompt ou l’image de référence est proche. N’activez l’audio que lorsque la parole générée, les effets sonores ou la musique font partie de l’examen. Utilisez default lorsque le résultat est destiné à l’utilisateur et sensible au temps ; utilisez flex lorsque la tâche peut attendre.

Cette séquence maintient la première évaluation bon marché sans modifier le flux API principal. Une fois qu’un clip passe l’examen visuel, augmentez la résolution, activez l’audio si nécessaire et exécutez un plus petit ensemble de candidats finaux.

FAQ

Seedance V1.5 Pro est-il disponible à la fois pour text-to-video et image-to-video sur Novita AI ?

Oui. Novita AI documente des endpoints Seedance V1.5 Pro T2V et I2V séparés : POST /v3/async/seedance-v1.5-pro-t2v et POST /v3/async/seedance-v1.5-pro-i2v.

Seedance V1.5 Pro génère-t-il de l’audio ?

Oui. Le champ generate_audio contrôle si la sortie inclut de l’audio synchronisé. Mettez-le à true pour la parole générée, les effets sonores ou la musique de fond, et false pour la vidéo silencieuse.

L’image-to-video est-il plus cher que le text-to-video ?

Les données actuelles de la page de prix vérifiées pour cet article listent les mêmes tarifs Seedance V1.5 Pro pour T2V et I2V à la même résolution, réglage audio et niveau de service.

Quelle est la différence entre le traitement en ligne et flex ?

La documentation décrit default comme inférence en ligne pour les scénarios sensibles au temps et flex comme inférence hors ligne pour les scénarios insensibles à la latence à 50 % du prix du mode en ligne.

Dois-je tester le 480P ou le 720P en premier ?

Utilisez le 480P pour une exploration large des prompts et des images de référence. Utilisez le 720P lorsque le concept est suffisamment proche pour un examen visuel plus sérieux. Vérifiez la facturation du 1080P avant de l’utiliser dans une grande exécution.

Articles recommandés