DeepSeek R1 7B: 90% من قوة DeepSeek R1 ولكن بكفاءة أجهزة تصل إلى 10 أضعاف

جدول المحتويات

ما هو DeepSeek R1 Distill Qwen 7B؟
اختبارات أداء DeepSeek R1 Distill Qwen 7B
متطلبات الأجهزة لـ DeepSeek R1 Distill Qwen 7B
DeepSeek R1 Distill Qwen 7B مقارنة بالنماذج الصغيرة الأخرى
كيف يمكن الوصول إلى نماذج Deepseek R1 المُقطّرة؟

قم بدعوة أصدقائك اليوم وستحصلان على 10 دولارات من رصيد واجهة برمجة تطبيقات LLM — أي ما يصل إلى 500 دولار من المكافآت الإجمالية في انتظارك!

Llama 3.2 1B، Qwen2.5 7B، Qwen 3 (0.6B، 1.7B، 4B)، GLM 4 — جميعها متاحة مجاناً الآن على Novita AI لتعزيز مشاريعك دون إنفاق فلس!

ابدأ البناء مع Novita AI اليوم!

هل تبحث عن تسخير قوة الذكاء الاصطناعي المتقدم دون إنفاق الكثير على الأجهزة؟ DeepSeek R1 Distill Qwen 7B يقدم 90% من أداء نموذج DeepSeek R1 671B الضخم مع تقليل متطلبات الأجهزة بشكل كبير. مع إصدار مُكمّم يعمل على وحدات معالجة رسومية متوسطة المدى (حتى 4.5 جيجابايت VRAM)، يمكّن هذا النموذج المطورين من التعامل مع الاستدلال الرياضي، المهام متعددة اللغات، وغيرها — بكفاءة وبتكلفة معقولة.

ستوضح لك هذه المقالة كيف يمكن لـ DeepSeek R1 Distill Qwen 7B مساعدتك!

ما هو DeepSeek R1 Distill Qwen 7B؟

اختبارات أداء DeepSeek R1 Distill Qwen 7B


النموذج	AIME 2024 pass@1	AIME 2024 cons@64	MATH-500 pass@1	GPQA Diamond pass@1	LiveCodeBench pass@1	تصنيف CodeForces
GPT 4o 0513	9.3	13.4	74.6	49.9	32.9	759
Claude 3.5 Sonnet 1022	16.0	26.7	78.3	65.0	38.9	717
o1 mini	63.6	80.0	90.0	60.0	53.8	1820
QwQ 32B Preview	44.0	60.0	90.6	54.5	41.9	1316
DeepSeek R1 Distill Qwen 7B	55.5	83.3	92.8	49.1	37.6	1189

يُعتبر DeepSeek R1 Distill Qwen 7B منافساً قوياً في مهام الاستدلال الرياضي، ويظهر نتائج تنافسية في الأداء العام.

ومع ذلك، فهو متأخر في اختبارات الأسئلة العامة والبرمجة مقارنة بالنماذج الأعلى أداءً مثل o1 mini و QwQ 32B Preview.

أداؤه الرياضي الاستثنائي يعود غالباً إلى أن نموذجه الأساسي هو Qwen 2.5 Math، المُحسّن بشدة لمهام الاستدلال.

متطلبات الأجهزة لـ DeepSeek R1 Distill Qwen 7B

نوع النموذج	الاسم	الحجم	متطلبات الأجهزة
النموذج الكامل	DeepSeek-R1-Distill-Qwen-7B	~18 جيجابايت	NVIDIA RTX 4090 (24 جيجابايت VRAM) أو أعلى
النموذج المُكمّم	DeepSeek-R1-Distill-Qwen-7B	~4.5 جيجابايت	NVIDIA RTX 3060 (12 جيجابايت VRAM) أو أعلى

من خلال استخدام التقطير، يُقلل DeepSeek R1 Distill Qwen 7B متطلبات الأجهزة بشكل كبير مع الاحتفاظ بأكثر من 90% من أداء النموذج الأصلي 671B، خاصة في الاستدلال الرياضي ومهام الأسئلة العامة. كما أن نموذجه المُكمّم يعزز إمكانية الوصول من خلال تمكين النشر على وحدات معالجة رسومية متوسطة المدى.

DeepSeek R1 Distill Qwen 7B مقارنة بالنماذج الصغيرة الأخرى

DeepSeek R1 Distill Qwen 7B مقابل Qwen 2.5 7B

الفئة	DeepSeek R1 Distill Qwen 7B	Qwen-2.5-7B
حجم النموذج	7.62B	7.61B
مفتوح المصدر	نعم	نعم
الهندسة المعمارية	Transformer	Transformer
دعم اللغات	أكثر من 29 لغة	أكثر من 29 لغة
متعدد الوسائط	نص إلى نص فقط	نص إلى نص فقط
بيانات التدريب	مُحسّن على بيانات الاستدلال	18 تريليون رمز
MATH (pass@1)	92.8	49.8
GPQA (pass@1)	49.1	36.4
VRAM (النموذج الكامل)	18 جيجابايت (RTX 4090 أو أعلى)	17.18 جيجابايت (RTX 4090)

DeepSeek-R1-Distill-Qwen-7B: قوي في المهام الرياضية، متطلبات أجهزة أقل (نموذج مُكمّم متاح).

Qwen-2.5-7B: أداء متوازن، يتفوق في البرمجة والمهام متعددة اللغات، مُدرّب على مجموعة بيانات أكبر.

DeepSeek R1 Distill Qwen 7B مقابل Qwen 3 8B

الفئة	DeepSeek R1 Distill Qwen 7B	Qwen 3 8B
حجم النموذج	7.62B	8.19B
مفتوح المصدر	نعم	نعم
الهندسة المعمارية	Transformer	Dense
دعم اللغات	أكثر من 29 لغة	119 لغة
متعدد الوسائط	نص إلى نص فقط	نص إلى نص فقط
MATH (pass@1)	92.8	90.0
GPQA (pass@1)	49.1	59.0
VRAM (النموذج الكامل)	18 جيجابايت (RTX 4090)	17.89 جيجابايت (RTX 4090)

DeepSeek: الأفضل للمهام الرياضية ومتطلبات GPU أقل (نموذج مُكمّم).

Qwen 3 8B: أفضل للمهام متعددة اللغات وتطبيقات السياقات الطويلة.

DeepSeek R1 Distill Qwen 7B مقابل Llama 3.1 8B

الفئة	DeepSeek R1 Distill Qwen 7B	Llama 3.1 8B
حجم النموذج	7.62B	8B
مفتوح المصدر	نعم	نعم
الهندسة المعمارية	Transformer	Dense Transformer
دعم اللغات	أكثر من 29 لغة	8 لغات
متعدد الوسائط	نص إلى نص	نص، كود (إدخال/إخراج)
بيانات التدريب	مُحسّن على بيانات الاستدلال	مُدرّب مسبقاً على ~15 تريليون رمز، مُحسّن بـ 25 مليون مثال اصطناعي
MATH (pass@1)	92.8	51.9 (CoT)
GPQA (pass@1)	49.1	30.4
VRAM (النموذج الكامل)	18 جيجابايت (RTX 4090, FP16)	17.17 جيجابايت (RTX 3090, FP16)

DeepSeek-R1-Distill-Qwen-7B: أقوى في المهام الرياضية والاستدلال.

Llama 3.1 8B: يتفوق في توليد الكود ويدعم سياقات أطول (128,000 رمز)، مما يجعله أفضل للمهام المعقدة ذات السياقات الطويلة.

كيف يمكن الوصول إلى نماذج Deepseek R1 المُقطّرة؟

Novita AI هي منصة سحابية للذكاء الاصطناعي توفر للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة تطبيقات بسيطة، مع توفير سحابة GPU موثوقة وبأسعار معقولة للبناء والتوسع.

بالإضافة إلى نماذج Deepseek R1 المُقطّرة، توفر Novita AI أيضاً Qwen2.5 7B، Qwen 3 (0.6B، 1.7B، 4B)، GLM 4 مجاناً لدعم تطوير مجتمع المصادر المفتوحة!

الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج

سجّل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

جرب نماذج Deepseek R1 المُقطّرة؟الآن!

الخطوة 2: اختر نموذجك وابدأ تجربة مجانية

تصفح الخيارات المتاحة وحدد النموذج الذي يناسب احتياجاتك.

الخطوة 3: احصل على مفتاح واجهة برمجة التطبيقات الخاص بك

للمصادقة مع واجهة برمجة التطبيقات، سنقدم لك مفتاح API جديد. ادخل إلى صفحة “الإعدادات”، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

الخطوة 4: تثبيت واجهة برمجة التطبيقات

قم بتثبيت واجهة برمجة التطبيقات باستخدام مدير الحزم الخاص بلغة البرمجة التي تستخدمها.

بعد التثبيت، قم باستيراد المكتبات الضرورية إلى بيئة التطوير الخاصة بك. قم بتهيئة واجهة برمجة التطبيقات باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال لاستخدام واجهة برمجة تطبيقات إكمال المحادثة لمستخدمي Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="session_nkvtuVXXxS-LlR7txjZ3Rox8GhLMuv1R8IrIySNwTPN7xHJ0SVErFx3kNwJgkUEpcSM4F8c6zmcvyfuc1h59gw==",
)

model = "deepseek/deepseek-r1-distill-llama-8b"
stream = True # or False
max_tokens = 2048
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

DeepSeek-R1-Distill-Qwen-7B هو نموذج مُحسّن بشكل كبير لمهام الاستدلال الرياضي، حيث يحقق أداءً استثنائياً في اختبارات مثل MATH. بينما يتأخر قليلاً في مهام الأسئلة العامة والبرمجة مقارنة بالنماذج الأخرى عالية الأداء، إلا أن متطلباته المنخفضة للأجهزة (مع خيار النموذج المُكمّم) تجعله في متناول جمهور أوسع.

الأسئلة المتكررة

ما هو DeepSeek R1 Distill Qwen 7B؟

DeepSeek-R1-Distill-Qwen-7B هو نسخة مُحسّنة ومُقطّرة من Qwen 2.5 Math تم تحسينها لمهام الاستدلال الرياضي والأسئلة العامة. يدعم معالجة النصوص متعددة اللغات ويوفر نموذجاً مُكمّماً للنشر على وحدات معالجة رسومية متوسطة المدى.

ما هي متطلبات الأجهزة لـ DeepSeek R1 Distill Qwen 7B؟

النموذج الكامل: ~18 جيجابايت VRAM (NVIDIA RTX 4090 أو أعلى).
النموذج المُكمّم: ~4.5 جيجابايت VRAM (NVIDIA RTX 3060 أو أعلى).

لماذا نستخدم DeepSeek R1 Distill Qwen 7B؟

Qwen3-Reranker-8B يحقق أعلى الدرجات:
MTEB-R: 69.02،
CMTEB-R: 77.45،
MTEB-Code: 81.22
يتفوق على النماذج الشائعة مثل BGE و GTE في عدة فئات.

Novita AI هي المنصة السحابية الشاملة التي تمكن طموحاتك في الذكاء الاصطناعي. واجهات برمجة تطبيقات متكاملة، بدون خادم، مثيل GPU — الأدوات الفعالة من حيث التكلفة التي تحتاجها. تخلص من البنية التحتية، ابدأ مجاناً، وحقق رؤيتك في الذكاء الاصطناعي.

DeepSeek R1 7B: 90% من قوة DeepSeek R1 ولكن بكفاءة أجهزة تصل إلى 10 أضعاف

ما هو DeepSeek R1 Distill Qwen 7B؟

اختبارات أداء DeepSeek R1 Distill Qwen 7B

متطلبات الأجهزة لـ DeepSeek R1 Distill Qwen 7B

DeepSeek R1 Distill Qwen 7B مقارنة بالنماذج الصغيرة الأخرى

DeepSeek R1 Distill Qwen 7B مقابل Qwen 2.5 7B

DeepSeek R1 Distill Qwen 7B مقابل Qwen 3 8B

DeepSeek R1 Distill Qwen 7B مقابل Llama 3.1 8B

كيف يمكن الوصول إلى نماذج Deepseek R1 المُقطّرة؟

الأسئلة المتكررة

قراءة موصى بها

Product

RESOURCES

Partners

Company

ما هو DeepSeek R1 Distill Qwen 7B؟

اختبارات أداء DeepSeek R1 Distill Qwen 7B

متطلبات الأجهزة لـ DeepSeek R1 Distill Qwen 7B

DeepSeek R1 Distill Qwen 7B مقارنة بالنماذج الصغيرة الأخرى

DeepSeek R1 Distill Qwen 7B مقابل Qwen 2.5 7B

DeepSeek R1 Distill Qwen 7B مقابل Qwen 3 8B

DeepSeek R1 Distill Qwen 7B مقابل Llama 3.1 8B

كيف يمكن الوصول إلى نماذج Deepseek R1 المُقطّرة؟

الأسئلة المتكررة

قراءة موصى بها

مقالات ذات صلة

Product

RESOURCES

Partners

Company