Novita bietet äußerst wettbewerbsfähige Preise auf dem Markt.
Zum Beispiel kostet ein Wan 2.1 I2V 720P 5-Sekunden-Video nur 0.3 $ pro Video, Ein Wan 2.1 I2V 480P 5-Sekunden-Video kostet nur 0.2 $ pro Video!
Unterstützt derzeit bis zu 3 Loras!
Starten Sie eine kostenlose Testversion auf Novita AI heute. Um Wan 2.1 API zu integrieren, besuchen Sie unsere Entwicklerdokumentation für weitere Informationen an.
Wan 2.1 I2V (Image-to-Video) ist ein hochmodernes Videogenerierungsmodell, das modernste Technologien wie Wan-VAE und Video Diffusion DiT kombiniert. Es zeichnet sich durch hochauflösende Videorekonstruktion, effiziente Komprimierung und nahtlose Text-zu-Video-Generierung aus, unterstützt durch einen robusten und sauberen Trainingsdatensatz.
Wan2.1 I2V-Fähigkeit

Wichtige Neuerungen von Wan 2.1
1. Wan-VAE
Übersicht
- Ein 3D-Variational-Autoencoder (VAE), der für effiziente Komprimierung und hochpräzise Bewegungswiedergabe entwickelt wurde.
- Kann 1080P-Videos unter Beibehaltung der zeitlichen Kohärenz kodieren und dekodieren.
- Integriert mehrere Strategien zur Optimierung der räumlich-zeitlichen Komprimierung, zur Reduzierung des Speicherverbrauchs und zur Gewährleistung zeitlicher Kausalität.
Behobene Probleme
- Effiziente Komprimierung: Reduziert den Speicher- und Rechenbedarf für Videodaten.
- High-Fidelity-Rekonstruktion: Stellt sicher, dass die generierten Videos eine hohe Qualität aufweisen und die Bewegungen kohärent sind.
- Zeitliche Konsistenz: Vermeidet häufige Probleme wie Bildunterbrechungen oder Jitter in generierten Videos.
2. Videodiffusion DiT
Übersicht
- Basiert auf Diffusion Transformers, erweitert durch das Flow Matching Framework.
- Unterstützt mehrsprachige Texteingabe (über T5 Encoder) und Texteinbettung (Cross-Attention).
- Verwendet ein gemeinsames MLP, um Modulationsparameter für Zeiteinbettungen vorherzusagen, sodass jeder Transformatorblock unterschiedliche Verzerrungen erlernen und so die Leistung verbessern kann.
Behobene Probleme
- Tiefe Integration der Text- und Videogenerierung: Ermöglicht dem Modell, Videos anhand von Textbeschreibungen besser zu verstehen und zu generieren.
- Verbesserte Generierungsleistung: Verbessert die Qualität und Ausdruckskraft generierter Videos erheblich, ohne die Anzahl der Parameter zu erhöhen.
- Multimodale Unterstützung: Verarbeitet mehrere Sprachen und Eingabetypen und erweitert so die Anwendungsszenarien.
3. Kandidatendatensatz
Übersicht
- Ein umfangreicher, kuratierter und deduplizierter Datensatz mit Bildern und Videos.
- Verwendet einen vierstufigen Datenbereinigungsprozess mit Schwerpunkt auf Datendimensionen, visueller Qualität und Bewegungsqualität.
- Erstellt ein vielfältiges und hochwertiges Trainingsset.
Behobene Probleme
- Datenrauschen und Redundanz: Entfernt effektiv minderwertige oder doppelte Daten und verbessert so die Effektivität der Trainingsdaten.
- Vielfalt und Qualität: Versorgt das Modell mit umfangreichen und sauberen Beispielen und verbessert so die Generalisierungs- und Generierungsfunktionen.
- Groß angelegte Schulungen: Unterstützt effizientes Training anhand großer, hochwertiger Datensätze.
Vbench von Wan 2.1
Wan 2.1 (Wan-14B) zeigt hervorragende Leistung bei Kernaufgaben wie ID-Konsistenz, physikalischer Plausibilität und Laufruhe. Seine Gesamtbewertung gehört zu den höchsten der Branche und macht es zu einem der führenden Modelle für die Videogenerierung. In Bereichen wie Stilisierungsfähigkeit und Kamerasteuerung besteht jedoch noch Verbesserungsbedarf.

Hardwareanforderungen von Wan 2.1
WAN 2.1 stellt hohe Hardwareanforderungen, insbesondere für hochauflösende und große Modellaufgaben. Der Speicherbedarf für WAN 2.1 I2V liegt bei fast 80 GB. Es wird empfohlen, mehrere High-End-Rechenzentrums-fähige GPUs (wie A100, H100 oder H20), um die Speicher- und Geschwindigkeitsanforderungen zu erfüllen. Verbraucher-Grade GPUs sind nur für kleine Modelle und Szenarien mit niedriger Auflösung geeignet.
| Modell | Einzelkartenkompatibel | multi-GPU Software Empfehlungen | Empfehlungsgrad |
|---|---|---|---|
| RTX 4090 | Nein | Nein | nur für T2V-1.3B bei 480P |
| H20 | Nicht unterstützt | 4 GPUs oder 8 GPUs | ★ ★ ★ |
| A800 / A100 | Unterstützt | 4 GPUs oder 8 GPUs | ★ ★ ★ ★ |
| H800 / H100 | Unterstützt | 4 GPUs oder 8 GPUs | ★ ★ ★ ★ ★ |
So greifen Sie auf Wan 2.1 zu über Novita AI?
Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle mithilfe unserer einfachen API bereitzustellen und gleichzeitig die kostengünstige und zuverlässige GPU Cloud zum Erstellen und Skalieren.
Schritt 1: Anmelden und auf die Modellbibliothek zugreifen
Melden Sie sich bei Ihrem Konto an und klicken Sie auf das Modellbibliothek .

Schritt 2: Wählen Sie Ihr Modell
Durchsuchen Sie die verfügbaren Optionen und wählen Sie das Modell aus, das Ihren Anforderungen entspricht.

Schritt 3: Starten Sie Ihre kostenlose Testversion

Schritt 4: Holen Sie sich Ihren API-Schlüssel
Zur Authentifizierung über die API erhalten Sie von uns einen neuen API-Schlüssel. Auf der Seite können Sie den API-Schlüssel wie im Bild gezeigt kopieren.

Schritt 5: Installieren der API
Installieren Sie die API mit dem Paketmanager für Ihre Programmiersprache.

Importieren Sie nach der Installation die erforderlichen Bibliotheken in Ihre Entwicklungsumgebung. Initialisieren Sie die API mit Ihrem API-Schlüssel, um mit der Interaktion zu beginnen Novita AI LLM. Dies ist ein Beispiel für die Verwendung der Chat-Vervollständigungs-API für Python-Benutzer.
Importanforderungen URL = "https://api.novita.ai/v3/async/wan-i2v" Nutzlast = { "extra": {"Webhook": { "URL": " ", "test_mode": { "enabled": Wahr, "return_task_status": " " } }}, "Modellname": " ", "Bild-URL": " ", "Breite": 123, "Höhe": 123, "Loras": [ { "Pfad": " ", "scale": {} } ], "seed": 123, "prompt": " ", "negative_prompt": " ", "Schritte": 123, "Leitlinienskala": 123, "Flussverschiebung": 123, "Sicherheitsprüfer aktivieren": True } Header = { "Inhaltstyp": " ", "Autorisierung": " " } Antwort = Anfragen.Anfrage("POST", URL, JSON=Nutzlast, Header=Header) drucken(Antwort.Text)
Wan 2.1 I2V (Image-to-Video) ist ein hochmodernes Videogenerierungsmodell, das modernste Technologien wie Wan-VAE und Video Diffusion DiT kombiniert. Es zeichnet sich durch hochauflösende Videorekonstruktion, effiziente Komprimierung und nahtlose Text-zu-Video-Generierung aus, unterstützt durch einen robusten und sauberen Trainingsdatensatz.
Häufige Fragen zum Großhandel mit Lebensmitteln und Getränken
Wan 2.1 I2V ist ein fortschrittliches Modell zur Generierung hochwertiger Videos aus Text- oder Bildeingaben. Seine Einzigartigkeit liegt in der hochauflösenden Bewegungswiedergabe, der zeitlichen Konsistenz und der mehrsprachigen Unterstützung für die Text-zu-Video-Generierung.
Wettbewerbsfähige Preisanpassung: 0.40 $ pro 5-Sekunden-720P-Video im Vergleich zu 2.39 $ auf ähnlichen Plattformen.
Benutzerfreundliche API mit ausführlicher Dokumentation für Entwickler.
Sie können Wan 2.1 I2V über die Novita AI Plattform. Melden Sie sich einfach an, wählen Sie das Modell aus, erhalten Sie Ihren API-Schlüssel und integrieren Sie die API in Ihre Entwicklungsumgebung.
Novita AI ist die All-in-One-Cloud-Plattform, die Ihre KI-Ambitionen unterstützt. Integrierte APIs, serverlos, GPU Instance – die kostengünstigen Tools, die Sie benötigen. Beseitigen Sie Infrastruktur, starten Sie kostenlos und verwirklichen Sie Ihre KI-Vision.
Lesen empfehlen
- Wan2.1 vs. HunyuanVideo: Architektur, Effizienz und Qualität
- Wan2.1 vs. Mochi 1: Krieg der Open-Source-KI-Videogenerierungsmodelle
- Bilder mühelos umwandeln: Image to Video AI API
Entdecken Sie mehr von Novita
Abonnieren Sie, um die neuesten Beiträge per E-Mail zu erhalten.





