يشهد مجال حوسبة الذكاء الاصطناعي تحولاً جذرياً مع أحدث تطورات إنفيديا من معمارية هوبر إلى معمارية بلاكويل. في مارس 2025، كشفت إنفيديا عن منصة بلاكويل ألترا للذكاء الاصطناعي، مُمثلةً بذلك نقلة نوعية نحو عصر التفكير بالذكاء الاصطناعي. لا تُمثل هذه المنصة مجرد تحسين تدريجي، بل قفزة نوعية تُتيح قدرات غير مسبوقة في تدريب الذكاء الاصطناعي والتفكير والاستنتاج.
تُمثل الرحلة من هوبر إلى بلاكويل نقلة نوعية في التكنولوجيا، مُصممة لتلبية المتطلبات المتطورة للذكاء الاصطناعي والحوسبة عالية الأداء. ستتناول هذه المدونة الميزات الرئيسية لكلا البنيتين، مُسلّطةً الضوء على تطوراتهما التقنية وتأثيرهما الأوسع على تطوير الذكاء الاصطناعي.
نظرة عامة على هندسة Hopper الخاصة بـ NVIDIA
المؤسسة الفنية
بُنيت بنية هوبر، التي سُميت تيمنًا برائدة الحوسبة غريس هوبر، على تقنية معالجة 4 نانومتر من شركة TSMC. وقد قدّمت الجيل الرابع من أنوية Tensor، وكانت رائدة في محرك Transformer Engine، المصمم خصيصًا لتسريع أحمال عمل الذكاء الاصطناعي. تميزت البنية بتقنية الربط NVLink 4.0، واستخدمت ذاكرة HBM3، مُرسيةً بذلك معايير جديدة للحوسبة عالية الأداء.
مقاييس الأداء الرئيسية
تمثل هندسة هوبر قفزة كبيرة في GPU تقنية متطورة، تُقدم تحسينات جوهرية في مقاييس أداء متعددة مع التركيز على كفاءة مركز البيانات. من تحسينات هائلة في أداء الذكاء الاصطناعي إلى تحسين عمليات الذاكرة وإمكانيات الربط المتقدمة، تُثبت هوبر مكانتها كحل شامل لتحديات الحوسبة الحديثة.
الميزات الرئيسية لهندسة هوبر:
- تحسينات الأداء الحسابي:
- دعم تنسيق FP8 مع زيادة في إنتاجية FP6 بمقدار 32 أضعاف
- تحسين أداء FP3 بمقدار 64 مرات
- زيادة في أداء الذكاء الاصطناعي بمقدار 30 مرة
- تحسين الذاكرة والتعليمات:
- تحسين زمن انتقال الذاكرة ومعدل الإنتاج
- تحسين أداء تعليمات نواة الموتر
- تكنولوجيا الربط:
- دعم PCIe Gen 5
- الجيل الرابع من NVLink
- قدرات الترابط المعززة
- خصائص مركز البيانات:
- التركيز على كفاءة الطاقة
- مناسب للنشر على نطاق واسع
- مُحسّن لمراكز البيانات المتقدمة وتطبيقات الذكاء الاصطناعي
الإنجازات والتحسينات الكبرى
- محرك المحولات:يتيح إجراء تعديلات دقيقة ديناميكية، وتحسين أحمال عمل الذكاء الاصطناعي.
- تعليمات DPX:تعزيز مهام البرمجة الديناميكية، مثل محاذاة التسلسل.
- الذاكرة المشتركة الموزعة:يحسن متعددGPU التواصل وقابلية التوسع.
هندسة بلاكويل: ما الجديد والمحسّن؟
أهم النقاط التكنولوجية
صُممت بنية بلاكويل، التي أُعلن عنها في مؤتمر GTC 2024، لإحداث ثورة في مجال الذكاء الاصطناعي التوليدي وأحمال عمل الذكاء الاصطناعي واسعة النطاق. تتميز هذه البنية بتقنية NVLink المتقدمة، وأنوية Tensor مخصصة، ومحرك RAS، مما يُمكّن من إنشاء نماذج ذكاء اصطناعي آنية مع ما يصل إلى 10 تريليونات معلمة. وتهدف بلاكويل إلى خفض استهلاك الطاقة لاستنتاجات الذكاء الاصطناعي بشكل كبير بما يصل إلى 25 ضعفًا.
تسليط الضوء على تحسينات الأداء الهامة
توفر الهندسة المعمارية الجديدة مكاسب غير مسبوقة في الأداء:
- تحسين أداء FP3 بمقدار 8 مرات
- قدرات تدريب الذكاء الاصطناعي أسرع بأربع مرات
- زيادة بمقدار 40 ضعفًا في أداء الاستدلال
- نسب كفاءة الطاقة أفضل بشكل ملحوظ
تتيح هذه التحسينات تدريبًا أسرع لنماذج الذكاء الاصطناعي الأكبر وعمليات الاستدلال الأكثر كفاءة.
مقارنة فنية: هوبر ضد بلاكويل
يمثل انتقال NVIDIA من بنية Hopper (H100) إلى بنية Blackwell (B200) قفزة تكنولوجية كبيرة في GPU التصميم. يُظهر تصميم بلاكويل الجديد تحسينات جوهرية في جميع المقاييس الرئيسية، مع تقدم ملحوظ في عدد الترانزستورات، وعرض نطاق الذاكرة، وسرعة الربط، وأداء الذكاء الاصطناعي.
يوضح الجدول التالي مقارنة تفصيلية للمواصفات بين الجيلين:
| الميزات | القادوس (H100) | بلاكويل (B200) |
|---|---|---|
| التصنيع | ترانزستورات TSMC 4N (80B) | ترانزستورات TSMC 4NP (208B) |
| ذاكرة | 80 جيجابايت HBM3 (3 تيرابايت/ثانية) | 144 جيجابايت HBM3e (4.8 تيرابايت/ثانية) |
| NVLink | الجيل الرابع (4 جيجابايت/ثانية) | الجيل الخامس (5 تيرابايت/ثانية) |
| أداء الذكاء الاصطناعي | 4 PFLOPS (FP16) | 20 PFLOPS (FP16) |
| كفاءة إستهلاك الطاقة | خط الأساس | تحسن في الاستدلال بمقدار 25 ضعفًا |
| حالات الاستخدام الرئيسية | أحمال عمل واسعة النطاق للذكاء الاصطناعي والحوسبة عالية الأداء | الذكاء الاصطناعي التوليدي، نماذج تريليون معلمة |
هوبر وبلاكويل في تطبيقات الذكاء الاصطناعي في العالم الحقيقي
منتجات هوبر المعمارية
تتوفر هندسة Hopper عبر العديد من خطوط المنتجات:
| المنتج | H100 إس إكس إم | H100 بكيي | H200 إس إكس إم |
|---|---|---|---|
| ذاكرة | 80GB HBM3 | 80 جيجا بايت اتش بي ام 2e | 141 جيجا بايت اتش بي ام 3e |
| النطاق الترددي الذاكرة | 3.35 TB / s | 2.04 TB / s | 4.8 TB / s |
| NVLink | 900 جيجابايت / ثانية | لا يوجد | 900 جيجابايت / ثانية |
| ماكس TDP | ما يصل إلى 700W | 350W | ما يصل إلى 700W |
| متعدد المثيلات GPUs | ما يصل إلى 7 MIGs @ 10GB | لا يوجد | ما يصل إلى 7 MIGs @ 16.5GB |
منتجات بلاكويل المعمارية
بلاكويل تقدم جيلًا جديدًا من مسرعات الذكاء الاصطناعي:
| المنتج | B100 | B200 | GB200 (جريس بلاكويل) |
|---|---|---|---|
| تصميم | بلاكويل GPU | بلاكويل GPU | 2× B200 GPUوحدة المعالجة المركزية s + Grace |
| ذاكرة | 192 جيجا بايت اتش بي ام 3e | 192 جيجا بايت اتش بي ام 3e | 384 جيجا بايت اتش بي ام 3e |
| النطاق الترددي الذاكرة | 8 TB / s | 8 TB / s | 16 TB / s |
| NVLink | 1.8 تيرابايت/ثانية (الجيل الخامس) | 1.8 تيرابايت/ثانية (الجيل الخامس) | 1.8 تيرابايت/ثانية (الجيل الخامس) |
| أداء FP4 | 7 فلوبس | 9 فلوبس | 20 فلوبس |
| TDP | 700W | 1000W | لا يوجد |
قدرات تدريب نموذج الذكاء الاصطناعي التوليدي
يُظهر كلا الهيكلين قدرات استثنائية في تدريب نماذج الذكاء الاصطناعي الكبيرة، حيث يُظهر بلاكويل سرعات تدريب أسرع بثلاث مرات مقارنةً بهوبر. تشمل التحسينات الرئيسية معالجة مُحسّنة للمحولات، وعرض نطاق ترددي مُحسّن للذاكرة، وقدرات معالجة متوازية أكثر كفاءة. تُمكّن الهيكلان من تدريب نماذج لغوية متزايدة الحجم مع تقليل استهلاك الطاقة ووقت التدريب.
بلاكويل ألترا: التطور القادم في الحوسبة القائمة على الذكاء الاصطناعي
تم الإعلان عن Blackwell Ultra في 18 مارس 2025، في GTC 2025، وهو يمثل أحدث تطور لمنصة الحوسبة بالذكاء الاصطناعي من NVIDIA.
المواصفات الفنية والتحسينات
- يتضمن خط الإنتاج GB300 NVL72 وHGX B300 NVL16
- يوفر GB300 NVL72 أداء ذكاء اصطناعي أكبر بمقدار 1.5 مرة من GB200 NVL72
- يحقق HGX B300 NVL16 مقارنة بهندسة Hopper ما يلي:
- استدلال أسرع بـ 11 مرة
- 7x حوسبة أكثر
- ذاكرة أكبر بأربع مرات
- يدمج NVIDIA Spectrum-X Ethernet وQuantum-X800 InfiniBand، مما يوفر معدل نقل بيانات يبلغ 800 جيجابايت في الثانية لكل GPU
- تتميز وحدات معالجة البيانات BlueField-3 بالقدرة على إنشاء شبكات متعددة المستأجرين، GPU مرونة الحوسبة، واكتشاف الأمان في الوقت الحقيقي
حلول الذاكرة والتبريد المتقدمة
- يستخدم ConnectX-8 SuperNIC لتحقيق إمكانيات RDMA عالية الأداء
- تم تحسينه لمصانع الذكاء الاصطناعي ومراكز البيانات السحابية للتخلص من اختناقات الأداء
- يدعم تكوينات مختلفة:
- 72 بلاكويل ألترا GPUs
- 36 وحدة معالجة مركزية Grace تعتمد على Neoverse من Arm
- تصميم على نطاق الرف يعمل كوحدة ضخمة واحدة GPU
LLM ميزات التحسين
- مُحسَّنة لاستدلال الذكاء الاصطناعي والذكاء الاصطناعي الوكيل:
- يدعم التفكير والتخطيط التكراري للمشاكل المعقدة متعددة الخطوات
- قادرة على إنشاء فيديو اصطناعي في الوقت الفعلي للتدريب
- دعم البرمجيات:
- إطار عمل استدلالي جديد مفتوح المصدر من NVIDIA Dynamo
- دعم نماذج NVIDIA Llama Nemotron Reason
- التكامل مع منصة برامج NVIDIA AI Enterprise
- من المتوقع توفر الخدمة من خلال كبرى شركات تصنيع الخوادم ومقدمي خدمات السحابة في النصف الثاني من عام 2025
اختار Novita AI لثقتك GPU شريك
مع استمرار تطور الحوسبة بالذكاء الاصطناعي مع بنيات NVIDIA الرائدة، أصبح اختيار النظام المناسب GPU يصبح الشريك السحابي أمرًا بالغ الأهمية. Novita AI تقدم منصة شاملة توفر الوصول إلى الأداء العالي GPUمع مزايا تكلفة كبيرة
إذا كنت مهتمًا Novita AIاتبع الخطوات التالية للبدء:
Step1:إنشاء حساب
قم بزيارة : Novita AIلإنشاء حساب، تفضل بزيارة موقع ". بعد إتمام التسجيل، توجه إلى "GPUاستخدم قسم "s" لاستكشاف الموارد المتاحة وبدء رحلتك في مجال الذكاء الاصطناعي.

Step2:حدد لديك GPU
توفر منصتنا مجموعة متنوعة من القوالب المعدة مسبقًا والمصممة خصيصًا لتلبية متطلباتك المحددة، إلى جانب المرونة اللازمة لإنشاء قوالب مخصصة حسب الحاجة.

Step3:تخصيص الإعداد الخاص بك
أطلق مشروعك اليوم مع مساحة تخزين مجانية للحاويات بسعة 60 جيجابايت - بدون أي تكاليف مسبقة. وسّع مساحة التخزين حسب الطلب مع نمو أعباء عمل الذكاء الاصطناعي لديك، وادفع فقط مقابل المساحة الإضافية التي تحتاجها.

Step4:قم بتشغيل مثيلك
ما عليك سوى تحديد "حسب الطلب"، وتأكيد إعداداتك وتسعيرك، ثم اضغط على "نشر" للبدء.

خاتمة
تُمثل الرحلة من هوبر إلى بلاكويل قفزة نوعية في قدرات حوسبة الذكاء الاصطناعي. فبينما وضع هوبر معايير جديدة لتدريب الذكاء الاصطناعي والحوسبة العلمية، تُواصل بلاكويل توسيع هذه الحدود من خلال تحسينات هائلة في الأداء والكفاءة والتنوع. هذا التطور لا يُعزز الريادة التقنية لشركة إنفيديا فحسب، بل يُسرّع أيضًا من اعتماد الذكاء الاصطناعي على نطاق أوسع في مختلف القطاعات. ومع تطلعنا إلى المستقبل، ستواصل هذه التطورات الهيكلية إتاحة إمكانيات جديدة في مجال الذكاء الاصطناعي والحوسبة العلمية.
الأسئلة الشائعة
يمثل Blackwell Ultra قمة الهندسة المعمارية مع تحسينات الأداء الإضافية وحلول التبريد المتقدمة والميزات المتخصصة المحسّنة خصيصًا لتدريب واستنتاج نماذج اللغة الكبيرة.
يعتمد الاختيار الأمثل على احتياجاتك الخاصة. يُعدّ Hopper مثاليًا لسير عمل الذكاء الاصطناعي الراسخ، بينما يُقدّم Blackwell أداءً فائقًا للتطبيقات المتطورة. Novita AI يمكننا تقديم توصيات مخصصة بناءً على احتياجاتك.
حافظت NVIDIA على توافقية البرامج بين الأجيال، مما يجعل عملية الترحيل سهلة نسبيًا. ستعمل معظم الأكواد المُحسّنة لـ Hopper على Blackwell دون أي تعديلات، مع أنه يُنصح بإعادة التجميع باستخدام أحدث مجموعة أدوات CUDA للاستفادة من التحسينات الخاصة بـ Blackwell.
Novita AI هي عبارة عن منصة سحابية للذكاء الاصطناعي توفر للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة التطبيقات البسيطة لدينا، مع توفيرها أيضًا بأسعار معقولة وموثوقة GPU السحابة للبناء والتوسع.
اقتراحات للقراءة
GPU مقارنة لنمذجة الذكاء الاصطناعي: دليل شامل
ما هو مقدار ذاكرة الوصول العشوائي (RAM) المطلوبة للتعلم الآلي؟
اختيار الأفضل GPU للتعلم الآلي في عام 2025: دليل كامل
اكتشف المزيد من نوفيتا
اشترك للحصول على أحدث المشاركات المرسلة إلى بريدك الإلكتروني.





