النقاط الرئيسية
سياق 10 ملايين رمز: أكبر بكثير من معظم النماذج.
دعم الوسائط المتعددة: يتعامل مع النصوص والصور كمدخلات.
القدرة على تعدد اللغات: يدعم 12 لغة، مما يتيح تطبيقات عالمية.
مفتوح المصدر: مجاني للاستخدام والتخصيص.
اختبر راحة بدء النسخة التجريبية المجانية مع واجهة برمجة تطبيقات Novita AI اليوم — سريعة وسهلة وبدون متاعب!
يتميز Llama 4 Scout بـ 10 ملايين رمز من السياق، مما يجعله مختلفًا عن معظم نماذج الذكاء الاصطناعي ذات نوافذ السياق المحدودة. هذه السعة العالية تجعله مثاليًا للتعامل مع المهام واسعة النطاق مثل تحليل المستندات الطويلة، التوليف متعدد اللغات، أو معالجة المدخلات متعددة الوسائط.
ما هو Llama 4 Scout؟
https://www.youtube.com/watch?v=MwHol73Cw\_I
نظرة عامة على Llama 4 Scout
| الخاصية | القيمة |
|---|---|
| تاريخ الإصدار | 5 أبريل 2025 |
| حجم النموذج | 109 مليار معامل (17 مليار نشط/رمز) |
| مفتوح المصدر | نعم |
| الهيكل | 16 خبيرًا مختلطًا (MoE) |
| السياق | 10 مليون (10000 ألف) |
| اللغات المدعومة | العربية، الإنجليزية، الفرنسية، الألمانية، الهندية، الإندونيسية، الإيطالية، البرتغالية، الإسبانية، التاغالوغية، التايلاندية، والفيتنامية |
| الوسائط المتعددة | المدخلات: نصوص وصور متعددة اللغات المخرجات: نصوص ورمز متعدد اللغات |
| بيانات التدريب | ~40 تريليون رمز |
| ما قبل التدريب | MetaP (تكوين خبير تكيفي + تدريب متوسط) |
| ما بعد التدريب | SFT (بيانات سهلة) → RL (بيانات صعبة) → DPO |
| نوع التنسور | BF16 |
معيار Llama 4 Scout

من Meta
كيفية الوصول إلى Llama 4 Scout محليًا؟
متطلبات الأجهزة لـ Llama 4 Scout
| طول السياق | ذاكرة Int4 VRAM | احتياجات GPU (Int4) | ذاكرة FP16 VRAM | احتياجات GPU (FP16) |
|---|---|---|---|---|
| 4 آلاف رمز | ~99.5 جيجابايت / ~76.2 جيجابايت | 1×H100 | ~345 جيجابايت | 8×H100 |
| 128 ألف رمز | ~334 جيجابايت | 8×H100 | ~579 جيجابايت | 8×H100 |
| 10 ملايين رمز | ~18.8 تيرابايت (يهيمن عليها KV Cache) | 240×H100 | نفس Int4 (هيمنة KV) | 240×H100 |
على الرغم من أن الإعلان يدعي أن LLaMA 4 Scout يمكن تشغيله على H100 واحد، إلا أن هذا ممكن فقط مع التكميم، وأطوال السياق القصيرة، وأحجام الدفعات الصغيرة، وإطار عمل استدلالي فعال.
تثبيت Llama 4 Scout محليًا
الخطوة 1: إعداد البيئة
- تثبيت Python: تأكد من أن نظامك يحتوي على إصدار مناسب من Python (مطلوب لـ Llama 4).
- إعداد GPU: تحقق من أن نظامك يحتوي على GPU قوي قادر على تشغيل النموذج.
- إنشاء بيئة Python: استخدم أدوات مثل
condaأوvenvلإدارة التبعيات.
الخطوة 2: الحصول على النموذج
- زيارة الموقع: اذهب إلى www.llama.com.
- اختيار النموذج: قم بتنزيل Llama 4 Scout.
الخطوة 3: تثبيت التبعيات
قم بتشغيل الأمر التالي لتثبيت حزم Python المطلوبة:
pip install llama-stack
الخطوة 4: التحقق من النموذج
اعرض جميع النماذج المتاحة وحدد معرف النموذج لـ Llama 4 Scout:
llama model list
الخطوة 5: تنزيل وتشغيل النموذج
- تحديد معرف النموذج: أدخل معرف النموذج الصحيح ورابط التنزيل.
- التحقق من انتهاء صلاحية الرابط: رابط التنزيل صالح عادة لمدة 48 ساعة فقط؛ قد تحتاج إلى إعادة تنزيله.
بمجرد اكتمال هذه الخطوات، ستكون جاهزًا لتشغيل Llama 4 Scout!
كيفية الوصول إلى Llama 4 Scout عبر API Novita؟
الخطوة 1: تسجيل الدخول والدخول إلى مكتبة النماذج
قم بتسجيل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

الخطوة 2: اختيار النموذج الخاص بك
تصفح الخيارات المتاحة واختر النموذج الذي يناسب احتياجاتك.

الخطوة 3: بدء النسخة التجريبية المجانية
ابدأ النسخة التجريبية المجانية لاستكشاف إمكانيات النموذج المحدد.

الخطوة 4: الحصول على مفتاح API الخاص بك
للمصادقة مع API، سنزودك بمفتاح API جديد. بالدخول إلى صفحة “الإعدادات”، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

الخطوة 5: تثبيت API
قم بتثبيت API باستخدام مدير الحزم الخاص بلغة البرمجة الخاصة بك.

بعد التثبيت، قم باستيراد المكتبات اللازمة إلى بيئة التطوير الخاصة بك. قم بتهيئة API باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال على استخدام API محادثات الإكمال لمستخدمي Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "meta-llama/llama-4-scout-17b-16e-instruct"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
استخدام Llama 4 Scout عبر GPU سحابي
الخطوة 1: تسجيل حساب
إذا كنت جديدًا في Novita AI، ابدأ بإنشاء حساب على موقعنا. بمجرد التسجيل، انتقل إلى علامة التبويب “GPUs” لاستكشاف الموارد المتاحة وبدء رحلتك.

الخطوة 2: استكشاف القوالب وخوادم GPU
ابدأ باختيار قالب يتناسب مع احتياجات مشروعك، مثل PyTorch أو TensorFlow أو CUDA. اختر الإصدار الذي يناسب متطلباتك، مثل PyTorch 2.2.1 أو CUDA 11.8.0. ثم اختر تكوين خادم GPU من نوع A100، الذي يوفر أداءً قويًا للتعامل مع أعباء العمل الثقيلة بسعة كافية من VRAM وRAM والقرص.

جرب وحدات GPU عالية الأداء من Novita AI
الخطوة 3: تخصيص النشر
بعد اختيار قالب وGPU، قم بتخصيص إعدادات النشر عن طريق ضبط المعلمات مثل إصدار نظام التشغيل (مثل CUDA 11.8). يمكنك أيضًا تعديل تكوينات أخرى لتكييف البيئة مع متطلبات مشروعك المحددة.

الخطوة 4: تشغيل مثيل
بمجرد الانتهاء من القالب وإعدادات النشر، انقر على “Launch Instance” لإعداد مثيل GPU الخاص بك. سيبدأ هذا في إعداد البيئة، مما يتيح لك البدء في استخدام موارد GPU لمهام الذكاء الاصطناعي الخاصة بك.

يجعل طول السياق غير المسبوق لـ Llama 4 Scout وقدراته على الوسائط المتعددة منه أداة ثورية للمهام الطويلة ومتعددة اللغات وواسعة النطاق. وتضمن قابلية التوسع وطبيعته مفتوحة المصدر المرونة للمطورين والباحثين.
الأسئلة الشائعة
ما الذي يجعل Llama 4 Scout فريدًا؟
سياق 10 ملايين رمز: أكبر بكثير من معظم النماذج.
دعم الوسائط المتعددة: يتعامل مع النصوص والصور كمدخلات.
القدرة على تعدد اللغات: يدعم 12 لغة، مما يتيح تطبيقات عالمية.
مفتوح المصدر: مجاني للاستخدام والتخصيص.
هل يمكنني استخدام Llama 4 Scout بدون GPU عالي المستوى؟
نعم، ولكن فقط للسياقات الأصغر (مثل 4 آلاف رمز) عن طريق تكميم النموذج. تتطلب السياقات الكاملة البالغة 10 ملايين رمز على الأقل 240×H100 GPU بسبب متطلبات الذاكرة، خاصة لذاكرة التخزين المؤقت KV. أو يمكنك اختيار Novita AI عبر API!
ما الأجهزة الموصى بها لـ Llama 4 Scout؟
السياقات الصغيرة (4 آلاف رمز): 1×H100 GPU
السياقات الكبيرة (128 ألف رمز): 8×H100 GPU
السياقات الكاملة (10 ملايين رمز): 240×H100 GPU
Novita AI هي منصة سحابية للذكاء الاصطناعي توفر للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة تطبيقات بسيطة، مع توفير سحابة GPU ميسورة التكلفة وموثوقة للبناء والتوسع.
