Wan 2.5 sur Novita AI : L'avenir de la création vidéo par IA

Wan 2.5 sur Novita AI : L'avenir de la création vidéo par IA

Wan 2.5, la dernière évolution propriétaire de la série de génération vidéo Wan, est désormais officiellement disponible sur Novita AI. Cette mise à jour introduit deux modèles dédiés :

  • Wan 2.5 Preview Text-to-Video (T2V) — Génère des vidéos de haute qualité directement à partir de descriptions textuelles, prenant en charge des durées de 5 et 10 secondes.
  • Wan 2.5 Preview Image-to-Video (I2V) — Crée des vidéos animées fluides à partir d’une image initiale et d’une guidance textuelle, également disponible aux formats 5 et 10 secondes.

Les deux versions inaugurent de nouvelles fonctionnalités audio, proposant le doublage automatique ou la possibilité de télécharger un fichier audio personnalisé pour une synchronisation parfaite. Basé sur un deep learning avancé, Wan 2.5 offre des visuels plus nets, des mouvements plus fluides et une génération plus rapide — permettant aux créateurs, aux éducateurs et aux marketeurs de produire du contenu vidéo de qualité professionnelle avec un effort minimal.

Voici les tarifs actuels de Wan 2.5 sur Novita AI :

Points clés de Wan 2.5

Wan 2.5 s’appuie sur la base solide de Wan 2.1, apportant des améliorations significatives à la fois sur la qualité de génération et les capacités globales du modèle. Ces progrès découlent de plusieurs innovations techniques fondamentales, notamment l’intégration d’une architecture Mélange d’Experts (MoE), l’expansion et l’affinage des données d’entraînement, et l’adoption de techniques de génération vidéo à haute compression.

1. Automatisation pilotée par l’IA
Gère automatiquement les transitions de scènes, l’éclairage et le timing — minimisant le montage manuel tout en garantissant une cohérence cinématographique.

2. Génération Text-to-Video et Image-to-Video
Transforme les prompts ou les scénarios en vidéos dynamiques prêtes à être partagées, réduisant considérablement le temps de production.

3. Synchronisation audio précise
Aligne parfaitement les voix off, la musique et les effets sonores pour des résultats audiovisuels de qualité professionnelle.

4. Sortie en haute définition
Prend en charge l’exportation jusqu’à 1080p et 4K, offrant des visuels nets et vibrants adaptés à toutes les plateformes.

5. Modèles flexibles et personnalisation
Propose une bibliothèque étendue de modèles avec des effets ajustables et des options de marque pour une liberté créative maximale.

6. Efficacité adaptée au matériel grand public
Fonctionne parfaitement même sur des PC standards et des GPU grand public — idéal pour les créateurs individuels ou les petites équipes.

Wan 2.5 intègre l’architecture Mélange d’Experts (MoE) dans son framework de diffusion vidéo. Dont l’efficacité a été prouvée dans les grands modèles de langage, le MoE permet d’augmenter considérablement le nombre total de paramètres du modèle sans augmenter significativement les coûts d’inférence. Dans la série A14B de Wan 2.5, une configuration à deux experts est introduite spécifiquement pour le processus de débruitage par diffusion : un expert haut-bruit gère la génération en phase initiale pour établir la composition globale, tandis qu’un expert bas-bruit gère les phases ultérieures pour améliorer les détails fins. Chaque expert contient environ 14 milliards de paramètres, ce qui porte le nombre total de paramètres à 27 milliards, avec seulement 14 milliards actifs à chaque étape,maintenant ainsi une charge de travail d’inférence et une utilisation de mémoire GPU quasi identiques.

Wan 2.5 vs. Wan 2.2 : Quoi de neuf ?

Bien que les deux appartiennent à la même famille de modèles, Wan 2.5 apporte des mises à niveau majeures qui améliorent les performances, l’efficacité et l’expérience utilisateur dans tous les domaines. Il s’appuie sur la base de Wan 2.1 avec un rendu plus rapide, un réalisme amélioré et un contrôle créatif étendu.

Comparaison Wan 2.5 Wan 2.2
Algorithme Utilise un deep learning avancé pour une précision supérieure et des visuels réalistes Utilise un deep learning standard, qualité vidéo modérée
Performances Offre une vitesse de génération plus rapide et gère efficacement les scènes complexes haute résolution Génère des vidéos lentement et prend en charge une sortie haute résolution limitée
Fonctionnalités Ajoute des modèles étendus, une synchronisation audio précise et des effets personnalisables Ne propose que des modèles et des effets basiques
Expérience utilisateur Design intuitif et convivial adapté aux débutants comme aux professionnels Interface conventionnelle nécessitant un certain apprentissage

Applications du modèle vidéo IA Wan 2.5

  • Vidéos marketing : Produisez sans effort du contenu promotionnel professionnel pour des produits, des campagnes ou des récits de marque.
  • Contenu pour les réseaux sociaux : Générez des vidéos captivantes adaptées à des plateformes comme Instagram, TikTok et YouTube pour augmenter l’engagement.
  • Ressources éducatives : Transformez des plans de cours, des tutoriels ou des conférences en matériels d’apprentissage interactifs et visuellement captivants.
  • Présentations d’entreprise : Créez rapidement et efficacement des communications internes soignées et des vidéos de formation.
  • Projets créatifs : Parfait pour les animations, le contenu narratif et l’art multimédia, permettant une expression créative illimitée.

Vitrine de génération vidéo Wan 2.5

Prompt T2V : Un jeune homme est assis immobile dans un métro, entouré de figures floues qui se déplacent rapidement. [Plan rapproché] Ses yeux, qui clignent à peine, renforcent le sentiment de solitude.

Image I2V :

I2V reference image

Prompt I2V : Une reine aux cheveux argentés se tient solennellement dans la cour d’une forteresse médiévale. Son manteau ondule doucement dans le vent tandis que des soldats se tiennent silencieusement derrière elle. La caméra effectue un zoom lent, capturant le mouvement subtil de ses cheveux et la lumière vacillante sur son armure. Une tonalité cinématographique avec une lumière douce du matin et une atmosphère dramatique.

Commencez avec Wan 2.5 sur Novita AI !

Wan 2.5 est désormais disponible sur Novita AI à seulement 0,75 $ par vidéo 1080p de 5 secondes (aussi bien en T2V qu’en I2V), vous permettant d’explorer une génération vidéo puissante tout en maîtrisant vos coûts.

Étape 1 : Connectez-vous et accédez à la bibliothèque de modèles

Connectez-vous à votre compte et cliquez sur le bouton Bibliothèque de modèles.

Étape 2 : Choisissez votre modèle

Parcourez les options disponibles et sélectionnez le modèle qui correspond à vos besoins.

Étape 3 : Récupérez votre clé API

Pour vous authentifier auprès de l’API, nous vous fournirons une nouvelle clé API. En accédant à la page des paramètres, vous pouvez copier la clé API comme indiqué sur l’image.

show how to find API key

Essayez Wan 2.5 via l’API de Novita AI

Étape 4 : Installez l’API

Installez l’API à l’aide du gestionnaire de paquets spécifique à votre langage de programmation.

Wan 2.5 T2V doc

Wan 2.5 I2V doc

Après l’installation, importez les bibliothèques nécessaires dans votre environnement de développement. Initialisez l’API avec votre clé API pour commencer à interagir avec le LLM de Novita AI. Ceci est un exemple d’utilisation de l’API de complétion de chat pour les utilisateurs Python. Consultez la documentation pour plus de détails.

Exemple d’API Image vers Vidéo Wan 2.5

import requests

url = "https://api.novita.ai/v3/async/wan-2.5-i2v-preview"

payload = {
    "input": {
        "prompt": "<string>",
        "negative_prompt": "<string>",
        "img_url": "<string>",
        "audio_url": "<string>"
    },
    "parameters": {
        "resolution": "<string>",
        "duration": 123,
        "prompt_extend": True,
        "audio": True,
        "seed": 123
    }
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.json())

En combinant automatisation intelligente et contrôle créatif flexible, Wan 2.5 redéfinit ce qui est possible en matière de génération vidéo alimentée par l’IA. Ses modèles doubles Text-to-Video et Image-to-Video, améliorés par une intégration audio précise et un rendu accéléré, rendent la création vidéo professionnelle plus rapide, plus fluide et plus accessible que jamais. Qu’il soit utilisé pour le storytelling, l’éducation ou le marketing, Wan 2.5 permet à chaque créateur de donner vie à ses idées sans effort, le tout sur une seule plateforme simplifiée.

Questions fréquemment posées

Qu’est-ce que Wan 2.5 ?

Wan 2.5 est le dernier modèle de génération vidéo par IA à code source fermé de la série Wan, conçu pour transformer du texte, des images ou de l’audio en vidéos complètes de haute qualité avec un effort minimal. Alimenté par un deep learning avancé, il simplifie l’ensemble du processus de production — permettant à quiconque de créer des vidéos professionnelles et visuellement cohérentes sans compétences de montage spécialisées.

Quelles sont les principales différences entre Wan 2.5 et Wan 2.2 ?

Wan 2.5 introduit une architecture Mélange d’Experts (MoE), un rendu plus rapide, un réalisme visuel supérieur, une synchronisation audio précise et la prise en charge des sorties 1080p/4K — ce qui le rend plus efficace et plus flexible que Wan 2.2.

Wan 2.5 est-il open source ?

Non. Wan 2.5 est un modèle à code source fermé, mais il est accessible au public via la plateforme Novita AI et l’intégration d’API.

Novita AI est la plateforme cloud tout-en-un qui donne vie à vos ambitions en IA. APIs intégrées, serverless, instances GPU — les outils rentables dont vous avez besoin. Éliminez les problèmes d’infrastructure, commencez gratuitement et concrétisez votre vision de l’IA.