وان 2.2 يُمثل جيلاً جديدًا من نماذج الفيديو مفتوحة المصدر cw خفيفة الوزن وقوية، مصممة لتوليد النصوص إلى الفيديو والصور إلى الفيديو بتماسك زمني قوي. صُممت ببنية مُحسّنة تُوازن بين الكفاءة وجودة المخرجات، مما يُوفر أداءً قويًا في الاستدلال حتى في ظل ظروف الأجهزة المحدودة. ولإطلاق العنان لإمكاناته الكاملة، يُعد فهم متطلبات ذاكرة الوصول العشوائي للفيديو (VRAM) أمرًا ضروريًا قبل النشر. سواء كنت تُخطط للاستدلال محليًا على المستهلك GPUعند توسيع نطاق أحمال العمل الإنتاجية من خلال مثيلات السحابة، يضمن تخصيص الذاكرة المناسب الاستقرار والسرعة.
يرشدك هذا الدليل إلى كل ما تحتاج إلى معرفته:
- GPU خيارات: من بطاقات المستهلكين إلى بطاقات المؤسسات GPUس، ابحث عن ما يعمل على تشغيل Wan 2.2 بكفاءة أكبر.
- إدارة VRAM: تعرف على كيفية مساهمة التكميم وأوقات التشغيل الحديثة في خفض تكاليف الذاكرة دون التضحية بالجودة.
- الوصول المبسط: استكشف الخيارات المستندة إلى واجهة برمجة التطبيقات (API) التي تتيح لك إنشاء مقاطع فيديو دون التعامل مع حدود الأجهزة.
وان 2.2: الأساسيات والنقاط البارزة
| الميزات | وان 2.2 |
| معامل | 14B |
| مفتوحة المصدر | نعم |
| دقة الشاشة | 1080P / 720P / 480P |
| تنسيق الإدخال/الإخراج | T2V، I2V |
| طول الفيديو | 5s |
| نسبة الجانب | 16:9/9:16/1:1 |
| معدل الاطار | 24FPS |
تحسين رئيسي
- إطار عمل الانتشار المدعوم من وزارة التعليميُقدّم Wan 2.2 تصميمًا قائمًا على مزيج من الخبراء (MoE) في نظام نشر الفيديو الخاص به. من خلال تفويض مراحل إزالة الضوضاء المختلفة إلى شبكات خبراء مخصصة، يُوسّع النموذج قدرته بكفاءة، مما يُحسّن الأداء دون زيادة متناسبة في تكلفة الحوسبة.
- التحكم المحسّن في الأسلوب المرئيتم تدريب Wan 2.2 على مجموعة بيانات غنية بتعليقات توضيحية دقيقة للضوء والتأطير والتباين ودرجة اللون، مما يوفر تحكمًا دقيقًا في الأسلوب السينمائي. يتيح هذا للمبدعين توجيه المزاج البصري والجماليات بدقة عالية عبر مختلف الأغراض الفنية.
- التدريب الموسع على الحركة والمشهدمقارنةً بإصدار Wan 2.1، يتضمن الإصدار الجديد صورًا أكثر بنسبة 65% ومقاطع فيديو أكثر بنسبة 80%، مما يتيح له نطاقًا أوسع من أنماط الحركة وهياكل المشاهد والسياقات السردية. تُمكّن هذه التغطية الأغنى للبيانات Wan 2.2 من تحسين تعميمه عبر مختلف البيئات البصرية.
ما هو مقدار VRAM الذي يحتاجه Wan 2.2 (T2V & I2V)؟
| توضيح | VRAM (تقريبًا) |
| 8 بت | 15.4 جيجا بايت |
| 6 بت | 12 جيجا بايت |
| 5 بت | 10.3 جيجا بايت |
| 4 بت | 8.56 جيجا بايت |
متطلبات الأجهزة
1. RTX 3090: نقطة انطلاق لسير العمل عالي الدقة
على الرغم من أن بطاقة RTX 3090 لا تزال قادرة على التعامل مع Wan 2.2، إلا أن ذاكرة الفيديو RAM بسعة 24 جيجابايت غالبًا ما تواجه صعوبة في التعامل مع دقة T2V الكاملة. يعتمد المستخدمون عادةً على النماذج المُكمّمة (Q6_K، Q5_K_M) ودقة أقل حول 480 بكسل.
الأداء أبطأ وأقل استقرارًا، ولكن مع التحسينات مثل VAE Decode وMemreduct، يظل من الممكن استخدامه لمهام إنشاء الفيديو خفيفة الوزن أو الاستكشافية.
2. RTX 4090: نقطة مثالية للأداء والتكلفة
تظل بطاقة RTX 4090 (ذاكرة VRAM سعة 24 جيجابايت) البطاقة الأكثر رواجًا في الجيل المحلي. فهي تُقدم 81 إطارًا بدقة 640×480 بكسل في حوالي 7 ثوانٍ/إطار، وتتطور إلى دقة 720 بكسل في حوالي 18 ثانية/إطار، مما يُحقق دقة عالية وتفاصيل دقيقة.
يعمل بسلاسة مع إعدادات Q8_0 أو الدقة الكاملة، مع أن وقت العرض وتكلفة الطاقة يرتفعان بشكل حاد مع زيادة الدقة. بالنسبة للمبدعين الأفراد أو الفرق الصغيرة، يُعدّ 4090 الخيار الأمثل للجمع بين السرعة والجودة والأسعار المعقولة.
3. RTX 5090: أداء من الطراز الأول لألعاب T2V الاحترافية&I2V
بفضل النطاق الترددي المتطور وذاكرة VRAM الواسعة، يحقق RTX 5090 ثانية واحدة لكل إطار بدقة 720×720 لتدفقات عمل I2V، مما يوفر تماسكًا ووضوحًا بصريًا متميزين.
يتعامل بسهولة مع النماذج عالية الدقة أو قليلة الكم، مع الحفاظ على دقة 720 بكسل ثابتة ودقة عرض منخفضة. بالنسبة للمبدعين الذين يبحثون عن جودة تُضاهي جودة الأفلام أو تسلسلات الحركة الممتدة، يُمثل جهاز 5090 التوازن الأمثل بين سهولة الاستخدام والأداء المتميز.
4. H100 SXM: سرعة واستقرار بمستوى مركز البيانات
مزودًا بذاكرة وصول عشوائي للفيديو (VRAM) سعة 80 جيجابايت، يوفر جهاز H100 SXM إنتاجية استثنائية وسعة تخزينية هائلة. في اختبارات الأداء، يُكمل الجهاز عملية توليد بيانات T2V بدقة 640×640 من ست خطوات في غضون 36 ثانية إلى دقيقة واحدة تقريبًا، مع الحفاظ على أداء مستقر عند دقة أعلى مثل 720×1280. تستغرق كل عملية تكرار ما بين 3 و7 ثوانٍ، مما يُتيح تقاربًا أسرع وحركة أكثر سلاسة حتى في المشاهد السينمائية.
تسمح ذاكرة VRAM الضخمة بالاستدلال بدقة كاملة دون الحاجة إلى التبليط أو التكميم، مما يجعلها مثالية لمختبرات الأبحاث وخطوط الإنتاج التي تتطلب الجودة وقابلية التوسع.
كيفية تحسين استخدام الذاكرة لشبكة Wan 2.2
على الرغم من أن Wan 2.2 يتطلب ذاكرة وصول عشوائي (VRAM) كبيرة، إلا أن التحسين الدقيق يُمكن أن يجعل توليد كلٍّ من T2V وI2V ممكنًا على مجموعة واسعة من الأجهزة. تتضمن إدارة الذاكرة الفعالة ثلاث طبقات: تحديد كمية النموذج، وتعديلات وقت التشغيل، وإعدادات مستوى سير العمل.
1. اختر مستوى التكميم المناسب
تحدد التكمية بشكل مباشر مقدار VRAM الذي يستهلكه النموذج.
- س 8_0:يوفر جودة شبه خالية من الخسارة ولكنه يتطلب حوالي 15 جيجابايت أو أكثر من ذاكرة VRAM.
- س6_ك / س5_ك_م:يوفر أفضل توازن بين الدقة والكفاءة، ويعمل بشكل مريح على بطاقات سعة 12 إلى 16 جيجابايت.
- س 4_0:يقلل الاستخدام للاختبار أو المعاينة، على الرغم من انخفاض التفاصيل الدقيقة وسلاسة الحركة بشكل واضح.
يضمن اختيار التكميم المناسب الاستقرار قبل أي تعديلات وقت التشغيل.
2. تطبيق تقنيات مثبتة لحفظ الذاكرة
يوصي مستخدمو المجتمع بعدة استراتيجيات عملية لتقليل ضغط الذاكرة:
- ديستورش متعددGPU تحاكي العقد ذاكرة الوصول العشوائي الافتراضية (VRAM) من خلال توزيع أحمال العمل عبر GPUs أو تبديل المساحة.
- يقوم Memreduct بمسح ذاكرة النظام غير المستخدمة بشكل منتظم لمنع تعطل وقت التشغيل.
- تعمل Tiled VAE Decode على معالجة الإطارات في بقع صغيرة، مما يقلل استخدام VRAM بعدة غيغابايت مع فقدان جودة لا يُذكر.
يمكن لهذه التقنيات أن تجعل إعدادات 12 جيجابايت قابلة للتطبيق للمشروعات ذات الدقة المتوسطة (480 بكسل - 640 بكسل).
3. تحسين الإعدادات وLoRAs
يعد ضبط مستوى الميزة أمرًا مهمًا بنفس القدر:
- تعطيل سرعة LoRAs مثل لايت اكس 2 في or سبب بالنسبة لـ T2V، حيث أنها تقلل من التنوع البصري وتستهلك ذاكرة إضافية.
- قم بتمكين Sage Attention، الذي يعمل على تعزيز الكفاءة بتكلفة شبه معدومة.
- حافظ على قيم Shift معتدلة (1–8)؛ قد تؤدي الإعدادات المتطرفة إلى زعزعة استقرار التوليد أو إهدار VRAM.
أطلق العنان للكفاءة والراحة باستخدام واجهة برمجة التطبيقات (API)!
Wan 2.2 متاح الآن على Novita AIسجّل دخولك وافتح تبويب إنشاء الفيديو لبدء الإنشاء. يمكنك ضبط جودة الإخراج على 480 بكسل أو 1080 بكسل، أو تحميل صورة لتحويلها إلى فيديو، أو إدخال مُطالبة لتحويل النص إلى فيديو. حدّد صفحة مكتبة النماذج للحصول على تفاصيل حول Wan 2.2 والنماذج الأخرى.
| الموديل | الطول/الدقة | السعر (USD) |
| وان 2.2 T2V / I2V | 5 ثانية / 480 ص | 0.09 دولار / فيديو |
| وان 2.2 T2V / I2V | 5 ثانية / 720 ص | 0.27 دولار / فيديو |
| وان 2.2 T2V / I2V | 5 ثانية / 1080 ص | 0.40 دولار / فيديو |
الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج
قم بتسجيل الدخول إلى حسابك وانقر على مكتبة النموذج .

الخطوة 2: اختر النموذج الخاص بك
تصفح الخيارات المتاحة واختر النموذج الذي يناسب احتياجاتك.

الخطوة 3: احصل على مفتاح API الخاص بك
للمصادقة باستخدام واجهة برمجة التطبيقات (API)، سنزودك بمفتاح واجهة برمجة تطبيقات جديد. بإدخال "الإعدادات"الصفحة، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

الخطوة 4: تثبيت واجهة برمجة التطبيقات (API)
قم بتثبيت واجهة برمجة التطبيقات (API) باستخدام مدير الحزم المخصص للغة البرمجة الخاصة بك.

بعد التثبيت، قم باستيراد المكتبات الضرورية إلى بيئة التطوير الخاصة بك. قم بتهيئة واجهة برمجة التطبيقات باستخدام مفتاح واجهة برمجة التطبيقات الخاص بك لبدء التفاعل مع Novita AI LLM.
الأسئلة الشائعة
Wan 2.2 هو نموذج خفيف الوزن لإنشاء مقاطع الفيديو، قادر على إنشاء نص إلى فيديو (T2V) وصورة إلى فيديو (I2V). يوفر حركة سينمائية، وتحكمًا دقيقًا في الإضاءة، وتدريبًا موسعًا على مشاهد متنوعة.
نعم. يمكن لبطاقات مثل RTX 3090 تشغيل عمليات بناء مُكمّمة (مثل Q6_K أو Q5_K_M) بدقة 480 بكسل باستخدام تقنيات توفير الذاكرة مثل فك تشفير VAE المُبلّط.
يقوم T2V بإنشاء فيديو كامل مباشرة من المطالبات النصية، بينما يبدأ I2V من صورة ويمتد إلى حركة، مما يوفر تماسكًا أفضل وعرضًا أسرع.
Novita AI منصة سحابية متكاملة تُمكّنك من تحقيق طموحاتك في مجال الذكاء الاصطناعي. واجهات برمجة تطبيقات متكاملة، بدون خوادم، GPU مثال - الأدوات الفعالة من حيث التكلفة التي تحتاجها. تخلص من البنية التحتية، وابدأ مجانًا، وحوّل رؤيتك للذكاء الاصطناعي إلى واقع.
اكتشف المزيد من نوفيتا
اشترك للحصول على أحدث المشاركات المرسلة إلى بريدك الإلكتروني.





