مقدمة
أطلقت Meta أحدث نموذج ذكاء اصطناعي لغوي متقدم لديها، Llama3 405B، وتعتزم الحفاظ على كونه مفتوح المصدر. تاريخ إصدار Llama3 405B هو 23 يوليو 2024. يحتوي هذا النموذج على أكثر من 400 مليار بارامتر. دعنا نستكشف ميزات النموذج وتطبيقاته المفيدة في هذه المدونة.
ما هو Llama3 405B؟
خلفية إصدار Llama3 405B
في أبريل 2024، قدمت Meta Llama 3، إصدار جديد من نماذج اللغات الكبيرة المدعومة بالذكاء الاصطناعي. تم تقديمه في البداية بحجمي 8B و 70B من البارامترات، وتفوق Llama 3 فور إطلاقه على أداء Llama 2 و Gemma و Gemini و Claude.

تعمل Meta على تنمية نظام بيئي مفتوح للذكاء الاصطناعي. الآن، تم ترقية نموذج أكثر قوة يُدعى Llama3 405 B ليشمل أكثر من 400 مليار بارامتر. يمثل هذا إنجازًا لمجتمع الذكاء الاصطناعي مفتوح المصدر حيث أن النموذج مفتوح المصدر لديه القدرة على التفوق على نموذج اللغة الكبير المغلق الرائد الحالي مثل GPT-4.

استجابة لإطلاقه، ستوفر Novita AI خدمة واجهة برمجة تطبيقات LLM لنموذج Llama3 405B. سنقدم أيضًا أحدث المعلومات على Discord. ابق على اطلاع معنا!
مقارنة نماذج عائلة Llama3
تمتلك عائلة نماذج Llama3 نموذجين ناجحين: Llama3 8B و Llama3 70B. فيما يلي بعض المقارنات كما هو موضح في الرسم البياني والنص بينهما وبين النموذج الجديد Llama 405B.


- حجم البارامترات
يحتوي Llama3 8B على 8 مليار بارامتر، و Llama3 70B على 70 مليارًا. بينما Llama3 405B أكبر بكثير مع أكثر من 400 مليار بارامتر.
- فهم واستجابة محسّنان
سيتميز Llama3 405B بفهم سياقي محسّن واستجابات أكثر دقة.
- القدرة متعددة اللغات
يتمتع Llama3 405B بأداء فائق في الترجمة والفهم عبر اللغات.
- تحسين التعلم بكميات قليلة من الأمثلة
يتميز الإصدار الجديد Llama3 405 بقدرة محسّنة على التكيف مع المهام الجديدة بأمثلة قليلة.
ما هي الميزات الرئيسية لـ Llama3 405B
أداء المعايير لـ Llama3 405B
فيما يلي أداء المعايير للرجوع إليها. يتفوق Llama3 405B على GPT-4o في اختبارات متعددة، بما في ذلك BoolQ، GSM8K، Hellaswag، MMLU-humanities، MMLU-other، MMLU-stem، و Winograd. تستند هذه النتائج إلى النموذج الأساسي لـ Llama3 405B، مما يشير إلى أن المزيد من التعديلات والتحسينات يمكن أن تطلق العنان لإمكانات أكبر للنموذج، مما يسمح له بتحقيق أداء أعلى في اختبارات المعايير لاحقًا.

يتنافس النموذج الرائد 405B مع نماذج الأساس الرائدة مثل GPT-4 و GPT-4o و Claude 3.5 Sonnet في مهام مختلفة، بناءً على التقييم البشري التجريبي.

الميزات التقنية
- الرموز المدربة مسبقًا: 15 تريليون
- عدد الطبقات: 118 طبقة
- حجم التضمين: 16,384
- حجم المفردات: 128,256
- طول السياق: إصدارات بطول سياق 128 ألف
مزايا المصدر المفتوح
- فعالية التكلفة
يمكن للمطورين، خاصة الشركات الصغيرة والشركات الناشئة التقنية، نشر هذه النماذج بحرية وإجراء تخصيصات إضافية لتلبية احتياجاتهم الفريدة.
- المرونة
تعد المرونة في التبديل بين النماذج المفتوحة والمغلقة للتخفيف من المخاطر المرتبطة بالاعتماد على نوع واحد من النماذج أمرًا بالغ الأهمية للشركات. بفضل ميزة المصدر المفتوح، لم يعد الترقية مقتصرًا على شركة واحدة ويمكن نشرها على نطاق واسع عبر العديد من الأنظمة المختلفة.
- أمان البيانات
يقلل النموذج المفتوح من مخاطر اختراق البيانات ويعزز الخصوصية، وهو أمر بالغ الأهمية لحماية البيانات الحساسة وضمان الامتثال التنظيمي. بالإضافة إلى ذلك، من الممكن تنفيذ إخفاء هوية البيانات والتشفير.
ما هو المطلوب لتشغيل Llama3 405B
عوامل التدريب
تعد مكاتب التدريب المخصصة والبنية التحتية الإنتاجية للتدريب المسبق والضبط الدقيق والتعليق التوضيحي والتقييم أمرًا بالغ الأهمية في التشغيل.
القدرة الحاسوبية
أولاً، يحتاج المطورون إلى امتلاك ذاكرة وصول عشوائي عادية 8 جيجابايت أو أكثر لتشغيل هذا النموذج. ثانيًا، معرفة أساسيات الخوارزمية أمر بالغ الأهمية في هذه العملية.
الإطار الأساسي
يؤدي استخدام إطار عمل API إلى تبسيط دمج نموذج LLM. تعمل أدواتهم ومكتباتهم على تسهيل عملية تشغيل نموذج Llama3 405B. الاستفادة من أطر العمل مثل Novita AI تبسط تنفيذ Llama3 405B لتعزيز الكفاءة.
الضبط الدقيق الخاضع للإشراف
هذا النموذج جاهز لتوسيع نطاق كمية بيانات الضبط الدقيق عبر القدرات. بالنسبة لمزيد من توليد البيانات الاصطناعية وهيكل المحولات المُحسَّن، هذه الخطوة ضرورية.
التطبيقات المفيدة
فيما يلي بعض التطبيقات المفيدة لـ Llama3 405B للرجوع إليها.
التفكير المعقد بناءً على التعليمات
يُظهر Llama3 405B أداءً مثيرًا للإعجاب عند مواجهة مجموعة متنوعة من الأسئلة، بما في ذلك الحساب البسيط ومشاكل التفكير المعقدة بناءً على التعليمات.

الاستخدام متعدد الوسائط
يوفر هذا النموذج أساسًا للمطورين لإنشاء مجموعات بيانات غنية وغير مقيدة. يمكن للمطورين استخدام مخرجاته بحرية لتدريب النماذج القديمة. يمكن لمجموعة نماذج Llama3 405B استخدام نتائج نماذجها لتعزيز النماذج الأخرى، مثل توليد البيانات الاصطناعية والتقطير. يمكننا توقع طفرة في النماذج القوية عالية الأداء التي تلتزم بأخلاقيات المصدر المفتوح.
مساعد البرمجة
يمكن للمستخدمين التفاعل مع المساعد الرقمي لـ Meta، المدعوم من Llama3 405B، القادر على الإجابة على الأسئلة المعقدة وحل مشكلات البرمجة.

التطبيقات متعددة اللغات
تم تصميم Llama3 405B للاستخدامات التجارية والبحثية بعدة لغات. النماذج المعدلة للتعليمات والمخصصة للنص فقط مناسبة للدردشة، بينما يمكن تخصيص النماذج المدربة مسبقًا لمهام إنشاء اللغة الطبيعية المتنوعة.
فرص لمطوري واجهات برمجة التطبيقات
سيتنافس المطورون على تقديم واجهات برمجة تطبيقات أكثر كفاءة وفعالية من حيث التكلفة لنشر Llama3 405B. يمثل هذا فرصة فريدة للمطورين لمقارنة كيفية تعامل المنصات المختلفة مع هذا النموذج الكبير. سيكون الفائزون هم أولئك الذين يقدمون واجهات برمجة تطبيقات تدير الحمل الحسابي مع الحفاظ على الدقة وتقليل التكاليف.
الخاتمة
عند إصدار Llama3 405B، سيكون هذا النموذج تقدمًا حاسمًا في تكنولوجيا الذكاء الاصطناعي، حيث يجمع بين البيانات الضخمة وأحدث تدريب للنماذج. من المتوقع أن يؤدي الإطلاق إلى موجة جديدة من تطبيقات ودراسات الذكاء الاصطناعي، مما يؤدي إلى تقدم في تقطير النماذج والاستدلال الواسع النطاق.
طوال هذه المدونة، استكشفنا المقارنة بين نماذج عائلة Llama3، والميزات الرئيسية والتطبيقات المتوقعة لنموذج Llama3 405. الإصدار الحالي هو نموذج أساسي، وفي المستقبل، سيجلب أداؤه وتطبيقاته مفاجآت للمطورين.
Novita AI هي المنصة السحابية الشاملة التي تمكن طموحاتك في الذكاء الاصطناعي. واجهات برمجة تطبيقات متكاملة، بدون خادم، مثيل GPU — الأدوات الفعالة من حيث التكلفة التي تحتاجها. تخلص من البنية التحتية، ابدأ مجانًا، وحقق رؤيتك في الذكاء الاصطناعي.
قراءة موصى بها
1.Meta Llama 3: أحدث إصدار من عائلة نموذج Llama يقتحم الحفلة
