DeepSeek R1 7B: 90% من قوة DeepSeek R1 ولكن بكفاءة أجهزة تصل إلى 10 أضعاف

DeepSeek R1 7B: 90% من قوة DeepSeek R1 ولكن بكفاءة أجهزة تصل إلى 10 أضعاف

قم بدعوة أصدقائك اليوم وستحصلان على 10 دولارات من رصيد واجهة برمجة تطبيقات LLM — أي ما يصل إلى 500 دولار من المكافآت الإجمالية في انتظارك!

Llama 3.2 1B، Qwen2.5 7B، Qwen 3 (0.6B، 1.7B، 4B)، GLM 4 — جميعها متاحة مجاناً الآن على Novita AI لتعزيز مشاريعك دون إنفاق فلس!

ابدأ البناء مع Novita AI اليوم!

هل تبحث عن تسخير قوة الذكاء الاصطناعي المتقدم دون إنفاق الكثير على الأجهزة؟ DeepSeek R1 Distill Qwen 7B يقدم 90% من أداء نموذج DeepSeek R1 671B الضخم مع تقليل متطلبات الأجهزة بشكل كبير. مع إصدار مُكمّم يعمل على وحدات معالجة رسومية متوسطة المدى (حتى 4.5 جيجابايت VRAM)، يمكّن هذا النموذج المطورين من التعامل مع الاستدلال الرياضي، المهام متعددة اللغات، وغيرها — بكفاءة وبتكلفة معقولة.

ستوضح لك هذه المقالة كيف يمكن لـ DeepSeek R1 Distill Qwen 7B مساعدتك!

ما هو DeepSeek R1 Distill Qwen 7B؟

ما هو DeepSeek R1 Distill Qwen 7B؟

اختبارات أداء DeepSeek R1 Distill Qwen 7B

النموذج AIME 2024 pass@1 AIME 2024 cons@64 MATH-500 pass@1 GPQA Diamond pass@1 LiveCodeBench pass@1 تصنيف CodeForces
GPT 4o 0513 9.3 13.4 74.6 49.9 32.9 759
Claude 3.5 Sonnet 1022 16.0 26.7 78.3 65.0 38.9 717
o1 mini 63.6 80.0 90.0 60.0 53.8 1820
QwQ 32B Preview 44.0 60.0 90.6 54.5 41.9 1316
DeepSeek R1 Distill Qwen 7B 55.5 83.3 92.8 49.1 37.6 1189

يُعتبر DeepSeek R1 Distill Qwen 7B منافساً قوياً في مهام الاستدلال الرياضي، ويظهر نتائج تنافسية في الأداء العام.

ومع ذلك، فهو متأخر في اختبارات الأسئلة العامة والبرمجة مقارنة بالنماذج الأعلى أداءً مثل o1 mini و QwQ 32B Preview.

أداؤه الرياضي الاستثنائي يعود غالباً إلى أن نموذجه الأساسي هو Qwen 2.5 Math، المُحسّن بشدة لمهام الاستدلال.

متطلبات الأجهزة لـ DeepSeek R1 Distill Qwen 7B

نوع النموذج الاسم الحجم متطلبات الأجهزة
النموذج الكامل DeepSeek-R1-Distill-Qwen-7B ~18 جيجابايت NVIDIA RTX 4090 (24 جيجابايت VRAM) أو أعلى
النموذج المُكمّم DeepSeek-R1-Distill-Qwen-7B ~4.5 جيجابايت NVIDIA RTX 3060 (12 جيجابايت VRAM) أو أعلى

من خلال استخدام التقطير، يُقلل DeepSeek R1 Distill Qwen 7B متطلبات الأجهزة بشكل كبير مع الاحتفاظ بأكثر من 90% من أداء النموذج الأصلي 671B، خاصة في الاستدلال الرياضي ومهام الأسئلة العامة. كما أن نموذجه المُكمّم يعزز إمكانية الوصول من خلال تمكين النشر على وحدات معالجة رسومية متوسطة المدى.

DeepSeek R1 Distill Qwen 7B مقارنة بالنماذج الصغيرة الأخرى

DeepSeek R1 Distill Qwen 7B مقابل Qwen 2.5 7B

الفئة DeepSeek R1 Distill Qwen 7B Qwen-2.5-7B
حجم النموذج 7.62B 7.61B
مفتوح المصدر نعم نعم
الهندسة المعمارية Transformer Transformer
دعم اللغات أكثر من 29 لغة أكثر من 29 لغة
متعدد الوسائط نص إلى نص فقط نص إلى نص فقط
بيانات التدريب مُحسّن على بيانات الاستدلال 18 تريليون رمز
MATH (pass@1) 92.8 49.8
GPQA (pass@1) 49.1 36.4
VRAM (النموذج الكامل) 18 جيجابايت (RTX 4090 أو أعلى) 17.18 جيجابايت (RTX 4090)

DeepSeek-R1-Distill-Qwen-7B: قوي في المهام الرياضية، متطلبات أجهزة أقل (نموذج مُكمّم متاح).

Qwen-2.5-7B: أداء متوازن، يتفوق في البرمجة والمهام متعددة اللغات، مُدرّب على مجموعة بيانات أكبر.

DeepSeek R1 Distill Qwen 7B مقابل Qwen 3 8B

الفئة DeepSeek R1 Distill Qwen 7B Qwen 3 8B
حجم النموذج 7.62B 8.19B
مفتوح المصدر نعم نعم
الهندسة المعمارية Transformer Dense
دعم اللغات أكثر من 29 لغة 119 لغة
متعدد الوسائط نص إلى نص فقط نص إلى نص فقط
MATH (pass@1) 92.8 90.0
GPQA (pass@1) 49.1 59.0
VRAM (النموذج الكامل) 18 جيجابايت (RTX 4090) 17.89 جيجابايت (RTX 4090)

DeepSeek: الأفضل للمهام الرياضية ومتطلبات GPU أقل (نموذج مُكمّم).

Qwen 3 8B: أفضل للمهام متعددة اللغات وتطبيقات السياقات الطويلة.

DeepSeek R1 Distill Qwen 7B مقابل Llama 3.1 8B

الفئة DeepSeek R1 Distill Qwen 7B Llama 3.1 8B
حجم النموذج 7.62B 8B
مفتوح المصدر نعم نعم
الهندسة المعمارية Transformer Dense Transformer
دعم اللغات أكثر من 29 لغة 8 لغات
متعدد الوسائط نص إلى نص نص، كود (إدخال/إخراج)
بيانات التدريب مُحسّن على بيانات الاستدلال مُدرّب مسبقاً على ~15 تريليون رمز، مُحسّن بـ 25 مليون مثال اصطناعي
MATH (pass@1) 92.8 51.9 (CoT)
GPQA (pass@1) 49.1 30.4
VRAM (النموذج الكامل) 18 جيجابايت (RTX 4090, FP16) 17.17 جيجابايت (RTX 3090, FP16)

DeepSeek-R1-Distill-Qwen-7B: أقوى في المهام الرياضية والاستدلال.

Llama 3.1 8B: يتفوق في توليد الكود ويدعم سياقات أطول (128,000 رمز)، مما يجعله أفضل للمهام المعقدة ذات السياقات الطويلة.

كيف يمكن الوصول إلى نماذج Deepseek R1 المُقطّرة؟

Novita AI هي منصة سحابية للذكاء الاصطناعي توفر للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة تطبيقات بسيطة، مع توفير سحابة GPU موثوقة وبأسعار معقولة للبناء والتوسع.

بالإضافة إلى نماذج Deepseek R1 المُقطّرة، توفر Novita AI أيضاً Qwen2.5 7B، Qwen 3 (0.6B، 1.7B، 4B)، GLM 4 مجاناً لدعم تطوير مجتمع المصادر المفتوحة!

الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج

سجّل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

تسجيل الدخول والوصول إلى مكتبة النماذج

جرب نماذج Deepseek R1 المُقطّرة؟الآن!

الخطوة 2: اختر نموذجك وابدأ تجربة مجانية

تصفح الخيارات المتاحة وحدد النموذج الذي يناسب احتياجاتك.

الخطوة 2: اختر نموذجك وابدأ تجربة مجانية

الخطوة 3: احصل على مفتاح واجهة برمجة التطبيقات الخاص بك

للمصادقة مع واجهة برمجة التطبيقات، سنقدم لك مفتاح API جديد. ادخل إلى صفحة “الإعدادات”، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

احصل على مفتاح API

الخطوة 4: تثبيت واجهة برمجة التطبيقات

قم بتثبيت واجهة برمجة التطبيقات باستخدام مدير الحزم الخاص بلغة البرمجة التي تستخدمها.

بعد التثبيت، قم باستيراد المكتبات الضرورية إلى بيئة التطوير الخاصة بك. قم بتهيئة واجهة برمجة التطبيقات باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال لاستخدام واجهة برمجة تطبيقات إكمال المحادثة لمستخدمي Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="session_nkvtuVXXxS-LlR7txjZ3Rox8GhLMuv1R8IrIySNwTPN7xHJ0SVErFx3kNwJgkUEpcSM4F8c6zmcvyfuc1h59gw==",
)

model = "deepseek/deepseek-r1-distill-llama-8b"
stream = True # or False
max_tokens = 2048
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

DeepSeek-R1-Distill-Qwen-7B هو نموذج مُحسّن بشكل كبير لمهام الاستدلال الرياضي، حيث يحقق أداءً استثنائياً في اختبارات مثل MATH. بينما يتأخر قليلاً في مهام الأسئلة العامة والبرمجة مقارنة بالنماذج الأخرى عالية الأداء، إلا أن متطلباته المنخفضة للأجهزة (مع خيار النموذج المُكمّم) تجعله في متناول جمهور أوسع.

الأسئلة المتكررة

ما هو DeepSeek R1 Distill Qwen 7B؟

DeepSeek-R1-Distill-Qwen-7B هو نسخة مُحسّنة ومُقطّرة من Qwen 2.5 Math تم تحسينها لمهام الاستدلال الرياضي والأسئلة العامة. يدعم معالجة النصوص متعددة اللغات ويوفر نموذجاً مُكمّماً للنشر على وحدات معالجة رسومية متوسطة المدى.

ما هي متطلبات الأجهزة لـ DeepSeek R1 Distill Qwen 7B؟

النموذج الكامل: ~18 جيجابايت VRAM (NVIDIA RTX 4090 أو أعلى).
النموذج المُكمّم: ~4.5 جيجابايت VRAM (NVIDIA RTX 3060 أو أعلى).

لماذا نستخدم DeepSeek R1 Distill Qwen 7B؟

Qwen3-Reranker-8B يحقق أعلى الدرجات:
MTEB-R: 69.02،
CMTEB-R: 77.45،
MTEB-Code: 81.22
يتفوق على النماذج الشائعة مثل BGE و GTE في عدة فئات.

Novita AI هي المنصة السحابية الشاملة التي تمكن طموحاتك في الذكاء الاصطناعي. واجهات برمجة تطبيقات متكاملة، بدون خادم، مثيل GPU — الأدوات الفعالة من حيث التكلفة التي تحتاجها. تخلص من البنية التحتية، ابدأ مجاناً، وحقق رؤيتك في الذكاء الاصطناعي.

قراءة موصى بها