Wan2.2 Ce modèle représente une nouvelle génération de modèles vidéo open source, légers et performants, conçus pour la conversion de texte en vidéo et d'image en vidéo avec une forte cohérence temporelle. Doté d'une architecture optimisée qui équilibre efficacité et qualité de sortie, il offre d'excellentes performances d'inférence même avec des ressources matérielles limitées. Pour exploiter pleinement son potentiel, il est essentiel de comprendre ses besoins en VRAM avant le déploiement. Que vous envisagiez une inférence locale sur un appareil grand public, ce modèle est fait pour vous. GPUPour la mise à l'échelle des charges de travail de production via des instances cloud, une allocation de mémoire appropriée garantit à la fois la stabilité et la vitesse.
Ce guide vous explique tout ce que vous devez savoir :
- GPU les choix: Des cartes grand public aux cartes d'entreprise GPUs, trouvez ce qui fait fonctionner Wan 2.2 le plus efficacement.
- Gestion de la VRAM : Découvrez comment la quantification et les environnements d'exécution modernes peuvent réduire les coûts de mémoire sans sacrifier la qualité.
- Accès simplifié : Explorez les options basées sur les API qui vous permettent de générer des vidéos sans vous soucier des limites matérielles.
Wan 2.2 : Principes de base et points forts
| Caractéristique | Wan2.2 |
| Paramètre | 14B |
| Open source | Oui |
| Résolution | 1080P / 720P / 480P |
| Format d'entrée/sortie | T2V, I2V |
| Durée de la vidéo | 5s |
| Ratio D'aspect | 16:9/9:16/1:1 |
| Fréquence d'images | 24FPS |
Amélioration clé
- Cadre de diffusion alimenté par le ministère de l'ÉducationWan 2.2 intègre une architecture de type « mixte d'experts » (MoE) à son système de diffusion vidéo. En déléguant différentes phases de débruitage à des réseaux d'experts dédiés, le modèle accroît efficacement sa capacité, améliorant ainsi les performances sans augmentation proportionnelle du coût de calcul.
- Contrôle visuel amélioréEntraîné sur un ensemble de données enrichi d'annotations précises concernant la lumière, le cadrage, le contraste et la tonalité des couleurs, Wan 2.2 offre un contrôle précis du style cinématographique. Les créateurs peuvent ainsi orienter l'ambiance visuelle et l'esthétique avec une grande fidélité, quelles que soient leurs intentions artistiques.
- Formation étendue sur les mouvements et les scènesComparée à Wan 2.1, la nouvelle version intègre plus de 65 % d'images et 80 % de clips vidéo supplémentaires, ce qui lui permet de couvrir un plus large éventail de mouvements, de structures de scènes et de contextes narratifs. Cette couverture de données enrichie confère à Wan 2.2 une meilleure capacité de généralisation dans divers environnements visuels.
De combien de VRAM a besoin Wan 2.2 (T2V et I2V) ?
| Quantification | VRAM (environ) |
| 8-bits | 15.4 GB |
| 6-bits | 12 GB |
| 5-bits | 10.3 GB |
| 4-bits | 8.56 GB |
Configuration matérielle requise
1. RTX 3090 : Point d’entrée vers les flux de travail haute fidélité
Bien que la RTX 3090 puisse gérer le WAN 2.2, ses 24 Go de VRAM peinent souvent à gérer la précision T2V maximale. Les utilisateurs se rabattent généralement sur des modèles quantifiés (Q6_K, Q5_K_M) et des résolutions réduites autour de 480p.
Les performances sont plus lentes et moins stables, mais grâce à des optimisations telles que le décodage VAE par tuiles et la réduction de mémoire, il reste utilisable pour des tâches de génération vidéo légères ou exploratoires.
2. RTX 4090 : Le meilleur compromis entre performances et prix
La RTX 4090 (24 Go de VRAM) reste la carte graphique haut de gamme la plus populaire pour la génération locale. Elle affiche 81 images par seconde en 640 × 480 pixels en environ 7 secondes par image et passe à une résolution de 720p en environ 18 secondes par image, offrant ainsi un niveau de détail élevé et une grande réactivité.
Elle gère sans problème les paramètres Q8_0 ou de pleine précision, bien que le temps de rendu et la consommation d'énergie augmentent considérablement avec la résolution. Pour les créateurs indépendants ou les petites équipes, la 4090 offre un excellent compromis entre vitesse, qualité et prix.
3. RTX 5090 : Performances de pointe pour les professionnels T2V&I2V
Avec une bande passante de pointe et une mémoire vidéo abondante, la RTX 5090 atteint 1 seconde par image à 720×720 pour les flux de travail I2V, offrant une cohérence et une netteté visuelle exceptionnelles.
Elle gère avec aisance les modèles à quantification complète ou légère, tout en maintenant une sortie 720p constante et un minimum d'artefacts. Pour les créateurs visant une qualité cinématographique ou des séquences d'action prolongées, la 5090 offre le meilleur compromis entre accessibilité et performances haut de gamme.
4. H100 SXM : Vitesse et stabilité de niveau centre de données
Doté de 80 Go de VRAM, le H100 SXM offre un débit et une marge mémoire exceptionnels. Lors de tests de performance réalisés par la communauté, il effectue une génération T2V en 6 étapes à une résolution de 640 × 640 en environ 36 secondes à 1 minute, tout en conservant des performances stables à des résolutions plus élevées telles que 720 × 1280. Chaque itération s'exécute entre 3 et 7 secondes, permettant une convergence plus rapide et des mouvements plus fluides, même dans les séquences cinématographiques.
Sa vaste mémoire VRAM permet une inférence en pleine précision sans pavage ni quantification, ce qui la rend idéale pour les laboratoires de recherche et les chaînes de production qui exigent à la fois qualité et évolutivité.
Comment optimiser l'utilisation de la mémoire pour WAN 2.2
Bien que WAN 2.2 exige une quantité importante de VRAM, une optimisation soignée permet de rendre la génération T2V et I2V possible sur une large gamme de matériels. Une gestion efficace de la mémoire repose sur trois niveaux : la quantification du modèle, les ajustements en temps réel et les paramètres de flux de travail.
1. Choisissez le niveau de quantification approprié
La quantification détermine directement la quantité de VRAM consommée par le modèle.
- Q8_0Offre une qualité quasi sans perte, mais nécessite environ 15 Go de VRAM ou plus.
- Q6_K / Q5_K_M: Offre le meilleur équilibre entre fidélité et efficacité, fonctionnant confortablement sur des cartes de 12 à 16 Go.
- Q4_0: Réduit l'utilisation pour les tests ou la prévisualisation, même si la finesse des détails et la fluidité des mouvements diminuent visiblement.
Le choix de la quantification appropriée garantit la stabilité avant toute modification en cours d'exécution.
2. Appliquer des techniques éprouvées de sauvegarde de la mémoire
Les utilisateurs de la communauté recommandent plusieurs stratégies pratiques pour réduire la pression sur la mémoire :
- Distorsion Multi-GPU Les nœuds simulent la VRAM virtuelle en répartissant les charges de travail sur l'ensemble du réseau. GPUs ou espace d'échange.
- Memreduct libère régulièrement la mémoire système inutilisée afin d'éviter les plantages en cours d'exécution.
- Le décodage VAE par blocs traite les images par petits patchs, réduisant ainsi l'utilisation de la VRAM de plusieurs gigaoctets avec une perte de qualité négligeable.
Ces techniques peuvent rendre viables les configurations de 12 Go pour les projets de résolution moyenne (480p–640p).
3. Optimiser les paramètres et les LoRA
Le réglage au niveau des fonctionnalités est tout aussi important :
- Désactiver les LoRA de vitesse comme lightx2v or causvid pour les T2V, car ils réduisent la variété visuelle et consomment de la mémoire supplémentaire.
- Activez Sage Attention, qui améliore l'efficacité à un coût quasi nul.
- Conservez des valeurs de décalage modérées (1 à 8) ; les paramètres extrêmes peuvent déstabiliser la génération ou gaspiller de la VRAM.
Débloquez l'efficacité et la commodité grâce à l'API !
Wan 2.2 est maintenant disponible sur Novita AIConnectez-vous et ouvrez l'onglet de génération vidéo pour commencer la création. Vous pouvez choisir une résolution de sortie de 480p ou 1080p, importer une image pour la conversion d'image en vidéo ou saisir un texte pour la conversion de texte en vidéo. Consultez les page de la bibliothèque de modèles pour plus de détails sur Wan 2.2 et autres modèles.
| Modèle | Longueur/Résolution | Prix (USD) |
| Wan 2.2 T2V / I2V | années 5/480p | 0.09 $ / vidéo |
| Wan 2.2 T2V / I2V | années 5/720p | 0.27 $ / vidéo |
| Wan 2.2 T2V / I2V | années 5/1080p | 0.40 $ / vidéo |
Étape 1 : Connectez-vous et accédez à la bibliothèque de modèles
Connectez-vous à votre compte et cliquez sur le bouton Bibliothèque de modèles .

Étape 2 : Choisissez votre modèle
Parcourez les options disponibles et sélectionnez le modèle qui correspond à vos besoins.

Étape 3 : obtenez votre clé API
Pour vous authentifier auprès de l'API, nous vous fournirons une nouvelle clé API. Saisissez le mot de passe « Paramètres« page, vous pouvez copier la clé API comme indiqué dans l'image.

Étape 4 : Installer l’API
Installez l'API à l'aide du gestionnaire de packages spécifique à votre langage de programmation.

Après l'installation, importez les bibliothèques nécessaires dans votre environnement de développement. Initialisez l'API avec votre clé API pour commencer à interagir avec Novita AI LLM.
Questions fréquemment posées
Wan 2.2 est un logiciel de génération vidéo léger capable de convertir du texte en vidéo (T2V) et des images en vidéo (I2V). Il offre des mouvements fluides, un contrôle précis de l'éclairage et un entraînement étendu sur diverses scènes.
Oui. Des cartes telles que la RTX 3090 peuvent exécuter des versions quantifiées (par exemple, Q6_K ou Q5_K_M) en 480p en utilisant des techniques d'économie de mémoire comme le décodage VAE par tuiles.
T2V génère une vidéo complète directement à partir d'invites textuelles, tandis que I2V part d'une image et l'étend en mouvement, offrant une meilleure cohérence et un rendu plus rapide.
Novita AI est la plateforme cloud tout-en-un qui concrétise vos ambitions en matière d'IA. API intégrées, sans serveur, GPU Instance : les outils économiques dont vous avez besoin. Éliminez l'infrastructure, démarrez gratuitement et concrétisez votre vision de l'IA.
Découvrez-en plus sur Novita
Abonnez-vous pour recevoir les derniers articles envoyés à votre adresse e-mail.





