الجيل القادم من الحوسبة القائمة على الذكاء الاصطناعي: رحلة NVIDIA من هوبر إلى بلاكويل

الجيل القادم من الحوسبة القائمة على الذكاء الاصطناعي: رحلة NVIDIA من هوبر إلى بلاكويل

يشهد مجال حوسبة الذكاء الاصطناعي تحولاً جذرياً مع أحدث تطورات إنفيديا من معمارية هوبر إلى معمارية بلاكويل. في مارس 2025، كشفت إنفيديا عن منصة بلاكويل ألترا للذكاء الاصطناعي، مُمثلةً بذلك نقلة نوعية نحو عصر التفكير بالذكاء الاصطناعي. لا تُمثل هذه المنصة مجرد تحسين تدريجي، بل قفزة نوعية تُتيح قدرات غير مسبوقة في تدريب الذكاء الاصطناعي والتفكير والاستنتاج.

تُمثل الرحلة من هوبر إلى بلاكويل نقلة نوعية في التكنولوجيا، مُصممة لتلبية المتطلبات المتطورة للذكاء الاصطناعي والحوسبة عالية الأداء. ستتناول هذه المدونة الميزات الرئيسية لكلا البنيتين، مُسلّطةً الضوء على تطوراتهما التقنية وتأثيرهما الأوسع على تطوير الذكاء الاصطناعي.

نظرة عامة على هندسة Hopper الخاصة بـ NVIDIA

المؤسسة الفنية

بُنيت بنية هوبر، التي سُميت تيمنًا برائدة الحوسبة غريس هوبر، على تقنية معالجة 4 نانومتر من شركة TSMC. وقد قدّمت الجيل الرابع من أنوية Tensor، وكانت رائدة في محرك Transformer Engine، المصمم خصيصًا لتسريع أحمال عمل الذكاء الاصطناعي. تميزت البنية بتقنية الربط NVLink 4.0، واستخدمت ذاكرة HBM3، مُرسيةً بذلك معايير جديدة للحوسبة عالية الأداء.

مقاييس الأداء الرئيسية

تمثل هندسة هوبر قفزة كبيرة في GPU تقنية متطورة، تُقدم تحسينات جوهرية في مقاييس أداء متعددة مع التركيز على كفاءة مركز البيانات. من تحسينات هائلة في أداء الذكاء الاصطناعي إلى تحسين عمليات الذاكرة وإمكانيات الربط المتقدمة، تُثبت هوبر مكانتها كحل شامل لتحديات الحوسبة الحديثة.

الميزات الرئيسية لهندسة هوبر:

  1. تحسينات الأداء الحسابي:
  • دعم تنسيق FP8 مع زيادة في إنتاجية FP6 بمقدار 32 أضعاف
  • تحسين أداء FP3 بمقدار 64 مرات
  • زيادة في أداء الذكاء الاصطناعي بمقدار 30 مرة
  1. تحسين الذاكرة والتعليمات:
  • تحسين زمن انتقال الذاكرة ومعدل الإنتاج
  • تحسين أداء تعليمات نواة الموتر
  1. تكنولوجيا الربط:
  • دعم PCIe Gen 5
  • الجيل الرابع من NVLink
  • قدرات الترابط المعززة
  1. خصائص مركز البيانات:
  • التركيز على كفاءة الطاقة
  • مناسب للنشر على نطاق واسع
  • مُحسّن لمراكز البيانات المتقدمة وتطبيقات الذكاء الاصطناعي

الإنجازات والتحسينات الكبرى

  • محرك المحولات:يتيح إجراء تعديلات دقيقة ديناميكية، وتحسين أحمال عمل الذكاء الاصطناعي.
  • تعليمات DPX:تعزيز مهام البرمجة الديناميكية، مثل محاذاة التسلسل.
  • الذاكرة المشتركة الموزعة:يحسن متعددGPU التواصل وقابلية التوسع.

هندسة بلاكويل: ما الجديد والمحسّن؟

أهم النقاط التكنولوجية

صُممت بنية بلاكويل، التي أُعلن عنها في مؤتمر GTC 2024، لإحداث ثورة في مجال الذكاء الاصطناعي التوليدي وأحمال عمل الذكاء الاصطناعي واسعة النطاق. تتميز هذه البنية بتقنية NVLink المتقدمة، وأنوية Tensor مخصصة، ومحرك RAS، مما يُمكّن من إنشاء نماذج ذكاء اصطناعي آنية مع ما يصل إلى 10 تريليونات معلمة. وتهدف بلاكويل إلى خفض استهلاك الطاقة لاستنتاجات الذكاء الاصطناعي بشكل كبير بما يصل إلى 25 ضعفًا.

تسليط الضوء على تحسينات الأداء الهامة

توفر الهندسة المعمارية الجديدة مكاسب غير مسبوقة في الأداء:

  • تحسين أداء FP3 بمقدار 8 مرات
  • قدرات تدريب الذكاء الاصطناعي أسرع بأربع مرات
  • زيادة بمقدار 40 ضعفًا في أداء الاستدلال
  • نسب كفاءة الطاقة أفضل بشكل ملحوظ

تتيح هذه التحسينات تدريبًا أسرع لنماذج الذكاء الاصطناعي الأكبر وعمليات الاستدلال الأكثر كفاءة.

مقارنة فنية: هوبر ضد بلاكويل

يمثل انتقال NVIDIA من بنية Hopper (H100) إلى بنية Blackwell (B200) قفزة تكنولوجية كبيرة في GPU التصميم. يُظهر تصميم بلاكويل الجديد تحسينات جوهرية في جميع المقاييس الرئيسية، مع تقدم ملحوظ في عدد الترانزستورات، وعرض نطاق الذاكرة، وسرعة الربط، وأداء الذكاء الاصطناعي.

يوضح الجدول التالي مقارنة تفصيلية للمواصفات بين الجيلين:

الميزاتالقادوس (H100)بلاكويل (B200)
التصنيعترانزستورات TSMC 4N (80B)ترانزستورات TSMC 4NP (208B)
ذاكرة80 جيجابايت HBM3 (3 تيرابايت/ثانية)144 جيجابايت HBM3e (4.8 تيرابايت/ثانية)
NVLinkالجيل الرابع (4 جيجابايت/ثانية)الجيل الخامس (5 تيرابايت/ثانية)
أداء الذكاء الاصطناعي4 PFLOPS (FP16)20 PFLOPS (FP16)
كفاءة إستهلاك الطاقةخط الأساستحسن في الاستدلال بمقدار 25 ضعفًا
حالات الاستخدام الرئيسيةأحمال عمل واسعة النطاق للذكاء الاصطناعي والحوسبة عالية الأداءالذكاء الاصطناعي التوليدي، نماذج تريليون معلمة

هوبر وبلاكويل في تطبيقات الذكاء الاصطناعي في العالم الحقيقي

منتجات هوبر المعمارية

تتوفر هندسة Hopper عبر العديد من خطوط المنتجات:

المنتجH100 إس إكس إمH100 بكييH200 إس إكس إم
ذاكرة80GB HBM380 جيجا بايت اتش بي ام 2e141 جيجا بايت اتش بي ام 3e
النطاق الترددي الذاكرة3.35 TB / s2.04 TB / s4.8 TB / s
NVLink900 جيجابايت / ثانيةلا يوجد900 جيجابايت / ثانية
ماكس TDPما يصل إلى 700W350Wما يصل إلى 700W
متعدد المثيلات GPUsما يصل إلى 7 MIGs @ 10GBلا يوجدما يصل إلى 7 MIGs @ 16.5GB

منتجات بلاكويل المعمارية

بلاكويل تقدم جيلًا جديدًا من مسرعات الذكاء الاصطناعي:

المنتجB100B200GB200 (جريس بلاكويل)
تصميمبلاكويل GPUبلاكويل GPU2× B200 GPUوحدة المعالجة المركزية s + Grace
ذاكرة192 جيجا بايت اتش بي ام 3e192 جيجا بايت اتش بي ام 3e384 جيجا بايت اتش بي ام 3e
النطاق الترددي الذاكرة8 TB / s8 TB / s16 TB / s
NVLink1.8 تيرابايت/ثانية (الجيل الخامس)1.8 تيرابايت/ثانية (الجيل الخامس)1.8 تيرابايت/ثانية (الجيل الخامس)
أداء FP47 فلوبس9 فلوبس20 فلوبس
TDP700W1000Wلا يوجد

قدرات تدريب نموذج الذكاء الاصطناعي التوليدي

يُظهر كلا الهيكلين قدرات استثنائية في تدريب نماذج الذكاء الاصطناعي الكبيرة، حيث يُظهر بلاكويل سرعات تدريب أسرع بثلاث مرات مقارنةً بهوبر. تشمل التحسينات الرئيسية معالجة مُحسّنة للمحولات، وعرض نطاق ترددي مُحسّن للذاكرة، وقدرات معالجة متوازية أكثر كفاءة. تُمكّن الهيكلان من تدريب نماذج لغوية متزايدة الحجم مع تقليل استهلاك الطاقة ووقت التدريب.

بلاكويل ألترا: التطور القادم في الحوسبة القائمة على الذكاء الاصطناعي

تم الإعلان عن Blackwell Ultra في 18 مارس 2025، في GTC 2025، وهو يمثل أحدث تطور لمنصة الحوسبة بالذكاء الاصطناعي من NVIDIA.

المواصفات الفنية والتحسينات

  • يتضمن خط الإنتاج GB300 NVL72 وHGX B300 NVL16
  • يوفر GB300 NVL72 أداء ذكاء اصطناعي أكبر بمقدار 1.5 مرة من GB200 NVL72
  • يحقق HGX B300 NVL16 مقارنة بهندسة Hopper ما يلي:
    • استدلال أسرع بـ 11 مرة
    • 7x حوسبة أكثر
    • ذاكرة أكبر بأربع مرات
  • يدمج NVIDIA Spectrum-X Ethernet وQuantum-X800 InfiniBand، مما يوفر معدل نقل بيانات يبلغ 800 جيجابايت في الثانية لكل GPU
  • تتميز وحدات معالجة البيانات BlueField-3 بالقدرة على إنشاء شبكات متعددة المستأجرين، GPU مرونة الحوسبة، واكتشاف الأمان في الوقت الحقيقي

حلول الذاكرة والتبريد المتقدمة

  • يستخدم ConnectX-8 SuperNIC لتحقيق إمكانيات RDMA عالية الأداء
  • تم تحسينه لمصانع الذكاء الاصطناعي ومراكز البيانات السحابية للتخلص من اختناقات الأداء
  • يدعم تكوينات مختلفة:
    • 72 بلاكويل ألترا GPUs
    • 36 وحدة معالجة مركزية Grace تعتمد على Neoverse من Arm
    • تصميم على نطاق الرف يعمل كوحدة ضخمة واحدة GPU

LLM ميزات التحسين

  • مُحسَّنة لاستدلال الذكاء الاصطناعي والذكاء الاصطناعي الوكيل:
    • يدعم التفكير والتخطيط التكراري للمشاكل المعقدة متعددة الخطوات
    • قادرة على إنشاء فيديو اصطناعي في الوقت الفعلي للتدريب
  • دعم البرمجيات:
    • إطار عمل استدلالي جديد مفتوح المصدر من NVIDIA Dynamo
    • دعم نماذج NVIDIA Llama Nemotron Reason
    • التكامل مع منصة برامج NVIDIA AI Enterprise
  • من المتوقع توفر الخدمة من خلال كبرى شركات تصنيع الخوادم ومقدمي خدمات السحابة في النصف الثاني من عام 2025

اختار Novita AI لثقتك GPU شريك

مع استمرار تطور الحوسبة بالذكاء الاصطناعي مع بنيات NVIDIA الرائدة، أصبح اختيار النظام المناسب GPU يصبح الشريك السحابي أمرًا بالغ الأهمية. Novita AI تقدم منصة شاملة توفر الوصول إلى الأداء العالي GPUمع مزايا تكلفة كبيرة

إذا كنت مهتمًا Novita AIاتبع الخطوات التالية للبدء:

Step1:إنشاء حساب

قم بزيارة : Novita AIلإنشاء حساب، تفضل بزيارة موقع ". بعد إتمام التسجيل، توجه إلى "GPUاستخدم قسم "s" لاستكشاف الموارد المتاحة وبدء رحلتك في مجال الذكاء الاصطناعي.

Novita AI لقطة شاشة موقع الويب

Step2:حدد لديك GPU

توفر منصتنا مجموعة متنوعة من القوالب المعدة مسبقًا والمصممة خصيصًا لتلبية متطلباتك المحددة، إلى جانب المرونة اللازمة لإنشاء قوالب مخصصة حسب الحاجة.

novita ai لقطة شاشة للموقع باستخدام وحدة معالجة الرسومات السحابية

Step3:تخصيص الإعداد الخاص بك

أطلق مشروعك اليوم مع مساحة تخزين مجانية للحاويات بسعة 60 جيجابايت - بدون أي تكاليف مسبقة. وسّع مساحة التخزين حسب الطلب مع نمو أعباء عمل الذكاء الاصطناعي لديك، وادفع فقط مقابل المساحة الإضافية التي تحتاجها.

novita ai لقطة شاشة للموقع

Step4:قم بتشغيل مثيلك

ما عليك سوى تحديد "حسب الطلب"، وتأكيد إعداداتك وتسعيرك، ثم اضغط على "نشر" للبدء.

novita ai لقطة شاشة للموقع

خاتمة

تُمثل الرحلة من هوبر إلى بلاكويل قفزة نوعية في قدرات حوسبة الذكاء الاصطناعي. فبينما وضع هوبر معايير جديدة لتدريب الذكاء الاصطناعي والحوسبة العلمية، تُواصل بلاكويل توسيع هذه الحدود من خلال تحسينات هائلة في الأداء والكفاءة والتنوع. هذا التطور لا يُعزز الريادة التقنية لشركة إنفيديا فحسب، بل يُسرّع أيضًا من اعتماد الذكاء الاصطناعي على نطاق أوسع في مختلف القطاعات. ومع تطلعنا إلى المستقبل، ستواصل هذه التطورات الهيكلية إتاحة إمكانيات جديدة في مجال الذكاء الاصطناعي والحوسبة العلمية.

الأسئلة الشائعة

ما الذي يجعل Blackwell Ultra مختلفًا عن Blackwell القياسي؟ GPUs?

يمثل Blackwell Ultra قمة الهندسة المعمارية مع تحسينات الأداء الإضافية وحلول التبريد المتقدمة والميزات المتخصصة المحسّنة خصيصًا لتدريب واستنتاج نماذج اللغة الكبيرة.

التي GPU هل يجب علي اختيار الهندسة المعمارية لمشروع الذكاء الاصطناعي الخاص بي؟

يعتمد الاختيار الأمثل على احتياجاتك الخاصة. يُعدّ Hopper مثاليًا لسير عمل الذكاء الاصطناعي الراسخ، بينما يُقدّم Blackwell أداءً فائقًا للتطبيقات المتطورة. Novita AI يمكننا تقديم توصيات مخصصة بناءً على احتياجاتك.

ما مدى صعوبة نقل أحمال العمل من Hopper إلى Blackwell؟

حافظت NVIDIA على توافقية البرامج بين الأجيال، مما يجعل عملية الترحيل سهلة نسبيًا. ستعمل معظم الأكواد المُحسّنة لـ Hopper على Blackwell دون أي تعديلات، مع أنه يُنصح بإعادة التجميع باستخدام أحدث مجموعة أدوات CUDA للاستفادة من التحسينات الخاصة بـ Blackwell.

Novita AI هي عبارة عن منصة سحابية للذكاء الاصطناعي توفر للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة التطبيقات البسيطة لدينا، مع توفيرها أيضًا بأسعار معقولة وموثوقة GPU السحابة للبناء والتوسع.

اقتراحات للقراءة

GPU مقارنة لنمذجة الذكاء الاصطناعي: دليل شامل

ما هو مقدار ذاكرة الوصول العشوائي (RAM) المطلوبة للتعلم الآلي؟

اختيار الأفضل GPU للتعلم الآلي في عام 2025: دليل كامل


اكتشف المزيد من نوفيتا

اشترك للحصول على أحدث المشاركات المرسلة إلى بريدك الإلكتروني.

اترك تعليق

انتقل إلى الأعلى

اكتشف المزيد من نوفيتا

اشترك الآن لمواصلة القراءة والوصول إلى الأرشيف الكامل.

مواصلة القراءة