عرض Llama 3.1 أصبح سهلاً: نصائح خبيرة للنجاح

جدول المحتويات

أبرز النقاط
مقدمة
فهم Llama 3.1: نظرة شاملة
ما هي تقييمات أداء Llama 3.1؟
الاستخدام المقصود لـ Llama 3.1
طريقتان لاستخدام عرض Llama 3.1 لم تجربهما بعد
كيفية دمج Llama 3.1 عبر واجهة برمجة تطبيقات Novita AI LLM؟
الخاتمة
الأسئلة المتكررة

أبرز النقاط

نماذج Llama 3.1: ستة نماذج جديدة مفتوحة المصدر من LLM متاحة بأحجام 8B و70B و405B معلمات، وتضم إصدارات أساسية ومُهيأة للتعليمات.
قدرات محسّنة: إدخال Llama Guard 3 وPrompt Guard لتحسين الأمان، مع دعم طول سياق يبلغ 128 ألف رمز.
تحسينات في الأداء: تحسينات كبيرة في مهام مثل توليد البيانات الاصطناعية، والترجمة متعددة اللغات، والاستدلال الرياضي.
حالات الاستخدام المقصودة: نظرة عامة على التطبيقات التجارية والبحثية، وميزات الدردشة الشبيهة بالمساعد، ومهام توليد النصوص الطبيعية، واستخدام مخرجات النموذج لتعزيز الوظائف.
الوصول إلى عرض Llama 3.1: أدلة شاملة حول استخدام عرض Llama 3.1 على منصات مثل Hugging Face وNovita AI، بما في ذلك تعليمات الإعداد وتقييمات النموذج.
التكامل مع Novita AI: خطوات دمج Llama 3.1 عبر واجهة برمجة تطبيقات Novita AI LLM، مما يتيح دمجًا سلسًا لمعالجة اللغة المتقدمة في تطبيقاتك.

مقدمة

يمثل Llama 3.1 تقدمًا كبيرًا في تكنولوجيا نماذج اللغة الكبيرة، حيث يقدم مجموعة متنوعة من النماذج لتطبيقات مختلفة. يسلط هذا العرض الضوء على نماذجه الستة الجديدة مفتوحة المصدر، وميزات الأمان المحسّنة، والدعم متعدد اللغات. سنستكشف قدرات كل نموذج واستخداماته المقصودة، إلى جانب مقاييس الأداء. بالإضافة إلى ذلك، سنقدم إرشادات عملية حول استخدام عرض Llama 3.1، مما يساعد المطورين والباحثين والمتحمسين على الاستفادة الفعالة من وظائفه.

فهم Llama 3.1: نظرة شاملة

يضم إصدار Llama 3.1 ستة نماذج جديدة مفتوحة المصدر من LLM مبنية على بنية Llama 3، متاحة للتنزيل بثلاثة أحجام: 8B و70B و405B معلمات من المستودع. يتضمن كل نموذج كلا الإصدارين الأساسي (المُدرّب مسبقًا) والمُهيأ للتعليمات، إلى جانب قدرات Llama Guard 3 وPrompt Guard لتعزيز الأمان. تدعم هذه النماذج طول سياق يبلغ 128 ألف رمز وتعمل بثماني لغات: الإنجليزية والألمانية والفرنسية والإيطالية والبرتغالية والهندية والإسبانية والتايلاندية. تستخدم مجموعة بيانات Llama 3.1 أيضًا Grouped-Query Attention (GQA) للمعالجة الفعالة للسياقات الأطول.

يمكن تلخيص النماذج الثلاثة على النحو التالي:

Llama 3.1 405B: إنه مناسب تمامًا لمهام مثل توليد البيانات الاصطناعية، والمعرفة العامة، وإنشاء النصوص الطويلة، والترجمة متعددة اللغات، وقد أظهر حتى تحسينات في القدرات الرياضية.
Llama 3.1 70B: مثالي لإنشاء المحتوى، والذكاء الاصطناعي التحادثي، والبحث والتطوير، يتفوق هذا النموذج في تلخيص النصوص، وتوليد الكود، واتباع التعليمات.
Llama 3.1 8B: الأفضل للبيئات ذات القدرة الحاسوبية المحدودة، هذا النموذج مثالي للنشر المحلي ويتفوق في تلخيص النصوص، والتصنيف، والترجمة اللغوية.

يمكنك أيضًا معرفة المزيد عن Llama 3.1 من خلال مشاهدة هذا الفيديو.

https://www.youtube.com/embed/JzSqxK3hjPQ

Llama 3 مقابل Llama 3.1

الجديد في Llama 3.1 مقارنة بـ Llama 3 هو أن نماذج التعليمات تم ضبطها بدقة لاستدعاء الأدوات، مما يجعلها مناسبة لحالات الاستخدام الوكيلية. هناك أداتان مدمجتان — البحث والاستدلال الرياضي باستخدام Wolfram Alpha — ويمكن تعزيزهما بشكل أكبر بوظائف JSON مخصصة.

إذا كنت ترغب في معرفة المزيد عن Llama 3 مقابل Llama 3.1، يمكنك النقر هنا لعرض مدونة مفصلة تقدم رؤى أعمق حول المقارنة.

ما هي تقييمات أداء Llama 3.1؟

في هذا القسم، سنناقش نتائج تقرير Meta حول نموذج Llama 3.1 في المعايير الآلية القياسية. لجميع التقييمات، استخدمت Meta مكتبة التقييم الداخلية الخاصة بها.

النماذج الأساسية المُدرّبة مسبقًا

النماذج المُهيأة للتعليمات

الاستخدام المقصود لـ Llama 3.1

Llama 3.1 هو نموذج لغوي متطور مصمم لتلبية مجموعة واسعة من المتطلبات التجارية والبحثية. تشمل تطبيقاته المقصودة ما يلي:

التطبيقات التجارية والبحثية: تم تصميم Llama 3.1 للاستخدام في سياقات تجارية وبحثية متنوعة، ويدعم عدة لغات.
الدردشة الشبيهة بالمساعد: تم تحسين النماذج النصية المُهيأة للتعليمات خصيصًا لإنشاء تجارب دردشة جذابة وفعالة تشبه المساعد.
مهام توليد النصوص الطبيعية: يمكن تكييف النماذج المُدرّبة مسبقًا بسهولة لمجموعة واسعة من مهام توليد النصوص الطبيعية، مما يجعلها أدوات متعددة الاستخدامات للمطورين.
استخدام مخرجات النموذج: تتيح مجموعة نماذج Llama 3.1 للمستخدمين الاستفادة من مخرجات نماذجها لتعزيز نماذج أخرى، بما في ذلك التطبيقات في توليد البيانات الاصطناعية وتقطير النماذج.
ترخيص المجتمع: يسهّل ترخيص مجتمع Llama 3.1 تنفيذ حالات الاستخدام المتنوعة هذه، مما يعزز الابتكار والتعاون.

طريقتان لاستخدام عرض Llama 3.1 لم تجربهما بعد

هل أنت مستعد لتجربة Llama 3.1؟ يعد عرض Llama 3.1 طريقة رائعة لاستكشاف هذا النموذج المتقدم من LLM. أولاً، تأكد من إعداد كل شيء. بعد اكتمال الإعداد، يمكنك تحميل النموذج. جميع الميزات متاحة بشكل افتراضي، سواء كنت ترغب في إنشاء نص بسيط، أو الترجمة، أو القيام بمهام أكثر تعقيدًا. يتيح لك العرض استكشاف ما يمكن أن يفعله Llama 3.1.

كيفية استخدام عرض Llama 3.1 على Hugging Face؟

يحتاج Llama 3.1 إلى تحديث طفيف في النمذجة لإدارة تحجيم RoPE بشكل فعال. باستخدام إصدار Transformers 4.43.2، يمكنك الوصول إلى نماذج Llama 3.1 الجديدة والاستفادة من جميع الأدوات المتاحة في نظام Hugging Face البيئي. تأكد من استخدام أحدث إصدار من Transformers:

pip install "transformers>=4.43.2" - upgrade

إليك كيفية استخدام نموذج meta-llama/Meta-Llama-3.1-8B-Instruct. يتطلب حوالي 16 جيجابايت من VRAM، مما يجعله مناسبًا للعديد من وحدات معالجة الرسوميات الاستهلاكية. ينطبق نفس مقتطف الكود على meta-llama/Meta-Llama-3.1-70B-Instruct، الذي يحتاج إلى 140 جيجابايت من VRAM، وmeta-llama/Meta-Llama-3.1-405B-Instruct، الذي يتطلب 810 جيجابايت. تجعل هذه المواصفات النماذج خيارات مثيرة للاهتمام لحالات الاستخدام الإنتاجي. يمكنك تقليل استهلاك الذاكرة بشكل أكبر عن طريق تحميلها في وضع 8 بت أو 4 بت.

from transformers import pipeline
import torch

model_id = "meta-llama/Meta-Llama-3.1-8B-Instruct"
pipe = pipeline(
    "text-generation",
    model=model_id,
    model_kwargs={"torch_dtype": torch.bfloat16},
    device="cuda",
)

messages = [
    {"role": "user", "content": "Who are you? Please, answer in pirate-speak."},
]
outputs = pipe(
    messages,
    max_new_tokens=256,
    do_sample=False,
)
assistant_response = outputs[0]["generated_text"][-1]["content"]
print(assistant_response)
# Arrrr, me hearty! Yer lookin' fer a bit o' information about meself, eh? Alright then, matey! I be a language-generatin' swashbuckler, a digital buccaneer with a penchant fer spinnin' words into gold doubloons o' knowledge! Me name be... (dramatic pause)...Assistant! Aye, that be me name, and I be here to help ye navigate the seven seas o' questions and find the hidden treasure o' answers! So hoist the sails and set course fer adventure, me hearty! What be yer first question?

كيفية استخدام عرض Llama 3.1 على Novita AI؟

أتساءل كيف تستخدم عرض Llama 3.1 على Novita AI؟ دعنا نستكشف معًا! اتبع الخطوات أدناه لاختبار نموذج Llama 3.1 بسهولة على Novita AI.

الخطوة 1: الوصول إلى عرض Llama 3.1: انتقل إلى علامة التبويب “Model API” وحدد “LLM API” لبدء تجربة نماذج Llama 3.1.

الخطوة 2: استكشاف نماذج مختلفة: في نموذج Novita AI غير المراقب، اختر نموذج Llama 3.1 الذي تريد استخدامه وتقييمه. إليك ما نقدمه لـ Llama 3.1:

الخطوة 3: إدخال الموجه والحصول على النتائج: أدخل موجهك في الحقل المخصص ليقوم النموذج بمعالجته.

كيفية دمج Llama 3.1 عبر واجهة برمجة تطبيقات Novita AI LLM؟

بعد تجربة عرض Llama 3.1 وتجربة ميزاته مباشرة، قد تكون مهتمًا بدمج هذه القدرات في تطبيقاتك الخاصة. في هذا القسم، سنستكشف كيفية إجراء تكاملات الاستدلال باستخدام واجهة برمجة تطبيقات Novita AI LLM. سيزودك هذا بالمعرفة اللازمة لدمج معالجة اللغة المتقدمة لـ Llama 3.1 بسلاسة في مشاريعك.

الخطوة 1: انتقل إلى موقع Novita AI الرسمي وقم بالتسجيل للحصول على حساب.

الخطوة 2: انتقل إلى قسم إدارة مفتاح API لإنشاء مفتاح API الخاص بك.

الخطوة 3: قم بزيارة توثيق Llama API لاستكشاف واجهات برمجة التطبيقات والنماذج المتاحة من خلال Novita AI.

الخطوة 4: حدد النموذج الذي يناسب احتياجاتك، ثم قم بإعداد بيئة التطوير الخاصة بك. قم بتكوين خيارات مثل المحتوى والدور والاسم والموجه لتخصيص تطبيقك.

لاستكشاف القائمة الكاملة للنماذج المتاحة، يمكنك زيارة قائمة نماذج Novita AI LLM.

الخطوة 6: قم بإجراء عدة اختبارات للتأكد من أن واجهة برمجة التطبيقات تعمل بشكل موثوق وتلبي احتياجات تطبيقك.

الخاتمة

باختصار، يقدم Llama 3.1 مجموعة مذهلة من الميزات والقدرات التي تميزه عن سابقه. بفضل نماذجه المتقدمة، والأمان المحسّن، والنهج القائم على المجتمع، فإنه يزود المستخدمين بالأدوات اللازمة لتسخير قوة الذكاء الاصطناعي بفعالية. سواء للبحث أو التطبيقات التجارية أو المشاريع الشخصية، فإن Llama 3.1 جاهز لتلبية احتياجات معالجة اللغة المتنوعة.

الأسئلة المتكررة

هل Llama 3.1 أفضل من Claude؟

يتفوق Llama 3.1 في توليد الكود لكن أداءه العام ليس جيدًا مثل Claude 3.5.

ما هي قيود الإصدار التجريبي من Llama 3.1؟

يقدم العرض التجريبي لـ Llama 3.1 اختبار الميزات مع قيود مقارنة بالإصدار الكامل، بما في ذلك الوصول المقيد، وقدرة المعالجة المنخفضة، وحدود الطلبات.

ما مقدار الذاكرة المطلوبة لتشغيل Llama 3.1 405B؟

يتطلب Llama 3.1 405B 1944 جيجابايت من ذاكرة GPU في وضع 32 بت. يتطلب Llama 3.1 405B 972 جيجابايت من ذاكرة GPU في وضع 16 بت. يتطلب Llama 3.1 405B 486 جيجابايت من ذاكرة GPU في وضع 8 بت.

ما مقدار VRAM المطلوب لتشغيل Llama 3.1 8B؟

لتشغيل Llama 3.1 8B، ستحتاج عادةً إلى 24 جيجابايت على الأقل من VRAM.

هل Llama 3.1 أفضل من GPT 4؟

إذا كنت تعطي الأولوية للدقة والكفاءة في مهام البرمجة، فقد يكون Llama 3 هو الخيار الأفضل.

نُشر في الأصل على Novita AI

Novita AI هي المنصة السحابية الشاملة التي تمكّن طموحاتك في الذكاء الاصطناعي. واجهات برمجة تطبيقات متكاملة، بدون خادم، مثيل GPU — الأدوات الفعالة من حيث التكلفة التي تحتاجها. تخلص من البنية التحتية، ابدأ مجانًا، وحقق رؤيتك في الذكاء الاصطناعي.

عرض Llama 3.1 أصبح سهلاً: نصائح خبيرة للنجاح

أبرز النقاط

مقدمة