دليل: الوصول إلى Llama 4 Scout محليًا، عبر API، أو على وحدات معالجة رسومية سحابية

دليل: الوصول إلى Llama 4 Scout محليًا، عبر API، أو على وحدات معالجة رسومية سحابية

النقاط الرئيسية

سياق 10 ملايين رمز: أكبر بكثير من معظم النماذج.

دعم الوسائط المتعددة: يتعامل مع النصوص والصور كمدخلات.

القدرة على تعدد اللغات: يدعم 12 لغة، مما يتيح تطبيقات عالمية.

مفتوح المصدر: مجاني للاستخدام والتخصيص.

اختبر راحة بدء النسخة التجريبية المجانية مع واجهة برمجة تطبيقات Novita AI اليوم — سريعة وسهلة وبدون متاعب!

يتميز Llama 4 Scout بـ 10 ملايين رمز من السياق، مما يجعله مختلفًا عن معظم نماذج الذكاء الاصطناعي ذات نوافذ السياق المحدودة. هذه السعة العالية تجعله مثاليًا للتعامل مع المهام واسعة النطاق مثل تحليل المستندات الطويلة، التوليف متعدد اللغات، أو معالجة المدخلات متعددة الوسائط.

ما هو Llama 4 Scout؟

https://www.youtube.com/watch?v=MwHol73Cw\_I

نظرة عامة على Llama 4 Scout

الخاصية القيمة
تاريخ الإصدار 5 أبريل 2025
حجم النموذج 109 مليار معامل (17 مليار نشط/رمز)
مفتوح المصدر نعم
الهيكل 16 خبيرًا مختلطًا (MoE)
السياق 10 مليون (10000 ألف)
اللغات المدعومة العربية، الإنجليزية، الفرنسية، الألمانية، الهندية، الإندونيسية، الإيطالية، البرتغالية، الإسبانية، التاغالوغية، التايلاندية، والفيتنامية
الوسائط المتعددة المدخلات: نصوص وصور متعددة اللغات
المخرجات: نصوص ورمز متعدد اللغات
بيانات التدريب ~40 تريليون رمز
ما قبل التدريب MetaP (تكوين خبير تكيفي + تدريب متوسط)
ما بعد التدريب SFT (بيانات سهلة) → RL (بيانات صعبة) → DPO
نوع التنسور BF16

معيار Llama 4 Scout

معيار llama 4 scout

من Meta

كيفية الوصول إلى Llama 4 Scout محليًا؟

متطلبات الأجهزة لـ Llama 4 Scout

طول السياق ذاكرة Int4 VRAM احتياجات GPU (Int4) ذاكرة FP16 VRAM احتياجات GPU (FP16)
4 آلاف رمز ~99.5 جيجابايت / ~76.2 جيجابايت 1×H100 ~345 جيجابايت 8×H100
128 ألف رمز ~334 جيجابايت 8×H100 ~579 جيجابايت 8×H100
10 ملايين رمز ~18.8 تيرابايت (يهيمن عليها KV Cache) 240×H100 نفس Int4 (هيمنة KV) 240×H100

على الرغم من أن الإعلان يدعي أن LLaMA 4 Scout يمكن تشغيله على H100 واحد، إلا أن هذا ممكن فقط مع التكميم، وأطوال السياق القصيرة، وأحجام الدفعات الصغيرة، وإطار عمل استدلالي فعال.

تثبيت Llama 4 Scout محليًا

الخطوة 1: إعداد البيئة

  • تثبيت Python: تأكد من أن نظامك يحتوي على إصدار مناسب من Python (مطلوب لـ Llama 4).
  • إعداد GPU: تحقق من أن نظامك يحتوي على GPU قوي قادر على تشغيل النموذج.
  • إنشاء بيئة Python: استخدم أدوات مثل conda أو venv لإدارة التبعيات.

الخطوة 2: الحصول على النموذج

  • زيارة الموقع: اذهب إلى www.llama.com.
  • اختيار النموذج: قم بتنزيل Llama 4 Scout.

الخطوة 3: تثبيت التبعيات

قم بتشغيل الأمر التالي لتثبيت حزم Python المطلوبة:

pip install llama-stack

الخطوة 4: التحقق من النموذج

اعرض جميع النماذج المتاحة وحدد معرف النموذج لـ Llama 4 Scout:

llama model list

الخطوة 5: تنزيل وتشغيل النموذج

  • تحديد معرف النموذج: أدخل معرف النموذج الصحيح ورابط التنزيل.
  • التحقق من انتهاء صلاحية الرابط: رابط التنزيل صالح عادة لمدة 48 ساعة فقط؛ قد تحتاج إلى إعادة تنزيله.

بمجرد اكتمال هذه الخطوات، ستكون جاهزًا لتشغيل Llama 4 Scout!

كيفية الوصول إلى Llama 4 Scout عبر API Novita؟

الخطوة 1: تسجيل الدخول والدخول إلى مكتبة النماذج

قم بتسجيل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

تسجيل الدخول والدخول إلى مكتبة النماذج

جرب Llama 4 Scout الآن!

الخطوة 2: اختيار النموذج الخاص بك

تصفح الخيارات المتاحة واختر النموذج الذي يناسب احتياجاتك.

اختر النموذج الخاص بك

الخطوة 3: بدء النسخة التجريبية المجانية

ابدأ النسخة التجريبية المجانية لاستكشاف إمكانيات النموذج المحدد.

ابدأ النسخة التجريبية المجانية

الخطوة 4: الحصول على مفتاح API الخاص بك

للمصادقة مع API، سنزودك بمفتاح API جديد. بالدخول إلى صفحة “الإعدادات”، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

احصل على مفتاح API

الخطوة 5: تثبيت API

قم بتثبيت API باستخدام مدير الحزم الخاص بلغة البرمجة الخاصة بك.

بعد التثبيت، قم باستيراد المكتبات اللازمة إلى بيئة التطوير الخاصة بك. قم بتهيئة API باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال على استخدام API محادثات الإكمال لمستخدمي Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "meta-llama/llama-4-scout-17b-16e-instruct"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  
  

استخدام Llama 4 Scout عبر GPU سحابي

الخطوة 1: تسجيل حساب

إذا كنت جديدًا في Novita AI، ابدأ بإنشاء حساب على موقعنا. بمجرد التسجيل، انتقل إلى علامة التبويب “GPUs” لاستكشاف الموارد المتاحة وبدء رحلتك.

لقطة شاشة موقع Novita AI

الخطوة 2: استكشاف القوالب وخوادم GPU

ابدأ باختيار قالب يتناسب مع احتياجات مشروعك، مثل PyTorch أو TensorFlow أو CUDA. اختر الإصدار الذي يناسب متطلباتك، مثل PyTorch 2.2.1 أو CUDA 11.8.0. ثم اختر تكوين خادم GPU من نوع A100، الذي يوفر أداءً قويًا للتعامل مع أعباء العمل الثقيلة بسعة كافية من VRAM وRAM والقرص.

لقطة شاشة موقع novita ai لاستخدام GPU سحابي

جرب وحدات GPU عالية الأداء من Novita AI

الخطوة 3: تخصيص النشر

بعد اختيار قالب وGPU، قم بتخصيص إعدادات النشر عن طريق ضبط المعلمات مثل إصدار نظام التشغيل (مثل CUDA 11.8). يمكنك أيضًا تعديل تكوينات أخرى لتكييف البيئة مع متطلبات مشروعك المحددة.

لقطة شاشة موقع novita ai لاستخدام GPU سحابي

الخطوة 4: تشغيل مثيل

بمجرد الانتهاء من القالب وإعدادات النشر، انقر على “Launch Instance” لإعداد مثيل GPU الخاص بك. سيبدأ هذا في إعداد البيئة، مما يتيح لك البدء في استخدام موارد GPU لمهام الذكاء الاصطناعي الخاصة بك.

لقطة شاشة موقع novita ai لاستخدام GPU سحابي

يجعل طول السياق غير المسبوق لـ Llama 4 Scout وقدراته على الوسائط المتعددة منه أداة ثورية للمهام الطويلة ومتعددة اللغات وواسعة النطاق. وتضمن قابلية التوسع وطبيعته مفتوحة المصدر المرونة للمطورين والباحثين.

الأسئلة الشائعة

ما الذي يجعل Llama 4 Scout فريدًا؟

سياق 10 ملايين رمز: أكبر بكثير من معظم النماذج.
دعم الوسائط المتعددة: يتعامل مع النصوص والصور كمدخلات.
القدرة على تعدد اللغات: يدعم 12 لغة، مما يتيح تطبيقات عالمية.
مفتوح المصدر: مجاني للاستخدام والتخصيص.

هل يمكنني استخدام Llama 4 Scout بدون GPU عالي المستوى؟

نعم، ولكن فقط للسياقات الأصغر (مثل 4 آلاف رمز) عن طريق تكميم النموذج. تتطلب السياقات الكاملة البالغة 10 ملايين رمز على الأقل 240×H100 GPU بسبب متطلبات الذاكرة، خاصة لذاكرة التخزين المؤقت KV. أو يمكنك اختيار Novita AI عبر API!

ما الأجهزة الموصى بها لـ Llama 4 Scout؟

السياقات الصغيرة (4 آلاف رمز): 1×H100 GPU
السياقات الكبيرة (128 ألف رمز): 8×H100 GPU
السياقات الكاملة (10 ملايين رمز): 240×H100 GPU

Novita AI هي منصة سحابية للذكاء الاصطناعي توفر للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة تطبيقات بسيطة، مع توفير سحابة GPU ميسورة التكلفة وموثوقة للبناء والتوسع.

قراءة موصى بها