Llama 3.1 8B: حل معضلة الأداء والتكلفة للمطورين

Llama 3.1 8B: حل معضلة الأداء والتكلفة للمطورين

النقاط البارزة

ميزة تكلفة ملحوظة: يتطلب ذاكرة VRAM منخفضة ومتطلبات أجهزة متواضعة، مما يتيح التشغيل على أجهزة شائعة.

أداء متميز: يتفوق في مهام متعددة تشمل المعرفة العامة، معالجة الكود، التفكير الرياضي، التفكير المنطقي، والمعالجة متعددة اللغات، مع تنوع قوي وقابلية تكيف مع المهام.

أسعار جذابة على Novita AI: بسعر تنافسي للغاية على Novita AI يبلغ 0.02 دولار لكل 1 مليون رمز إدخال و 0.05 دولار لكل 1 مليون رمز إخراج.

بالنسبة للمطورين والهواة والشركات الصغيرة والمتوسطة، غالبًا ما يأتي السعي لاستخدام نموذج ذكاء اصطناعي بنقطة ألم مشتركة: موازنة الأداء والتكلفة. يبحث الكثيرون عن حل لا يتطلب استثمارًا ضخمًا في أجهزة عالية الجودة أو يرهق الميزانية بتكاليف الرموز، مع الاستمرار في تقديم نتائج موثوقة عبر مجموعة من المهام. يظهر Llama 3.1 8B كإجابة مثالية لهذه المخاوف.

قم بإحالة أصدقائك إلى Novita AI وستحصلان أنتما الاثنان على 10 دولارات من أرصدة LLM API—حتى 500 دولار من المكافآت الإجمالية.

لدعم مجتمع المطورين، تتوفر نماذج Llama 3.2 1B و Qwen2.5-7B و Qwen 3 0.6B و Qwen 3 1.7B و Qwen 3 4B مجانًا حاليًا على Novita AI.

qwen 2.5 7b

ما هو Llama 3.1 8B؟

LLaMA 3.1 8B هو نموذج لغة كبير مفتوح المصدر مبني بمعمارية المحولات الكثيفة. يدعم لغات متعددة ويقدم أداءً قويًا في توليد النصوص والكود، مما يجعله مناسبًا للتطبيقات العامة.

llama 3.1

  • حجم النموذج: 1B
  • مفتوح المصدر: نعم
  • المعمارية: محول كثيف (Dense Transformer)
  • طول السياق: 128,000 رمز

دعم اللغات

يدعم الإنجليزية والألمانية والفرنسية والإيطالية والبرتغالية والهندية والإسبانية والتايلندية.

القدرة متعددة الوسائط

يقبل النص كمدخل وينتج نصًا أو كودًا كمخرج. لا يدعم إدخال الصور أو الصوت.

بيانات التدريب

تم التدريب المسبق على حوالي 15 تريليون رمز من مصادر متاحة للجمهور. تم الضبط الدقيق باستخدام أكثر من 25 مليون مثال تعليمي تم إنشاؤها اصطناعيًا، بالإضافة إلى مجموعات بيانات تعليمية عامة.

معايير Llama 3.1 8B (مقارنة مع نماذج أخرى)

llama 3.2 1b benchmark

  • أداء شامل جيد: حقق Llama 3.1 8B نتائج جيدة نسبيًا في اختبارات معايير متعددة. على سبيل المثال، حصل على درجات عالية في اختبارات مثل IFEval (80.4) و GSM8K (8-shot, CoT) (84.5)، مما يشير إلى أن لديه نقاط قوة معينة في القدرات العامة والتفكير الرياضي.
  • قدرة برمجية متميزة: يؤدي بشكل جيد في الاختبارات المتعلقة بالكود مثل HumanEval (0-shot) (72.6) و MBPP EvalPlus (base) (0-shot) (72.8)، مما يشير إلى أن لديه قدرات قوية في مهام معالجة الكود.
  • مجال للتحسين: درجاته ليست الأعلى في بعض الاختبارات، مثل MATH (0-shot, CoT) (51.9) و GPQA (0-shot, CoT) (32.8). هذا يشير إلى أنه لا يزال هناك مجال لتحسين الأداء في سيناريوهات التفكير الرياضي والإجابة على الأسئلة المحددة.

متطلبات أجهزة Llama 3.1 8B

النموذج ذاكرة VRAM المطلوبة (FP16) وحدات GPU النموذجية
LLaMA 3.1 8B 17.17 جيجابايت RTX 3090 (12 جيجابايت، غير كافية)
2× RTX 4060 (8 جيجابايت لكل منهما)
Qwen3-8B 17.89 جيجابايت RTX 3090
2× RTX 4060
LLaMA 3 8B 17.17 جيجابايت RTX 3090
2× RTX 4060
Gemma 3 4B 10.29 جيجابايت RTX 3090
2× RTX 4060
LLaMA 3.2 1B 3.14 جيجابايت RTX 4060

بينما يقدم LLaMA 3.1 8B توازنًا محسنًا جيدًا بين القدرة واستخدام الذاكرة ضمن فئة 8B معلمة، لا يزال طلبه على الأجهزة مرتفعًا بالنسبة لمعظم الهواة أو المطورين الذين يستخدمون وحدة GPU واحدة. بالنسبة للنشر خفيف الوزن، توفر النماذج الأصغر مثل Gemma 3 4B أو LLaMA 3.2 1B متطلبات VRAM أقل بكثير، مما يجعلها أكثر إتاحة على الأجهزة الاستهلاكية.

كيفية الوصول إلى Llama 3.2 1B؟

الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج

قم بتسجيل الدخول إلى حسابك وانقر على زر مكتبة النماذج (Model Library) .

Log In and Access the Model Library

الخطوة 2: اختر النموذج الخاص بك

تصفح الخيارات المتاحة واختر النموذج الذي يناسب احتياجاتك.

choose your model

الخطوة 3: ابدأ النسخة التجريبية المجانية

ابدأ النسخة التجريبية المجانية لاستكشاف قدرات النموذج المختار.

llama 3.1 8b

جرب Llama 3.1 8B الآن!

الخطوة 4: احصل على مفتاح API الخاص بك

للمصادقة مع API، سنوفر لك مفتاح API جديدًا. بالدخول إلى صفحة “الإعدادات”، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

get api key

الخطوة 5: تثبيت API

قم بتثبيت API باستخدام مدير الحزم الخاص بلغة البرمجة الخاصة بك.

بعد التثبيت، قم باستيراد المكتبات اللازمة في بيئة التطوير الخاصة بك. قم بتهيئة API باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال لاستخدام واجهة برمجة تطبيقات الدردشة لمستخدمي Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<مفتاح API الخاص بك من Novita AI>",
)

model = "meta-llama/llama-3.1-8b-instruct-bf16"
stream = True # أو False
max_tokens = 2048
system_content = """كن مساعدًا مفيدًا"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "مرحبًا!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

يحقق LLaMA 3.1 8B توازناً بين الأداء وقابلية التوسع، خاصة في المهام متعددة اللغات ومهام البرمجة. ومع ذلك، قد يجد المطورون ذوو الأجهزة المحدودة أن متطلباته مرتفعة. بالنسبة لحالات الاستخدام خفيفة الوزن، يوفر Llama 3.2 1B أو Gemma 3 4B بدائل فعالة من حيث التكلفة. من خلال وصول API الخاص بـ Novita AI، يمكن للمطورين استكشاف هذه النماذج بسهولة دون استثمار في وحدات GPU عالية الجودة.

الأسئلة الشائعة

ما هو Llama 3.1 8B؟

نموذج مفتوح المصدر بحجم 8 مليار معلمة محسّن لتوليد النصوص والكود للأغراض العامة.

هل يمكنني تشغيل Llama 3.1 8B على وحدة GPU واحدة؟

يتطلب الاستدلال 3.14 جيجابايت من VRAM؛ ويحتاج الضبط الدقيق إلى 14.11 جيجابايت من VRAM.

أين يمكنني استخدام Llama 3.1 8B؟

يمكنك الوصول إليه عبر منصة Novita AI باستخدام واجهة برمجة تطبيقات Python البسيطة الخاصة بهم لإتمام الدردشة والمزيد.

Novita AI هي منصة سحابية للذكاء الاصطناعي توفر للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة API البسيطة الخاصة بنا، مع توفير سحابة GPU ميسورة التكلفة وموثوقة للبناء والتوسع.

قراءات موصى بها