DeepSeek V3 مقابل R1: التدريب المرحلي مقابل دورات SFT-RL التكرارية

DeepSeek V3 مقابل R1: التدريب المرحلي مقابل دورات SFT-RL التكرارية

النقاط الرئيسية

التدريب
DeepSeek V3: يتبع مسارًا تقليديًا للتدريب المسبق (14.8 تريليون رمز) → الضبط الدقيق الخاضع للإشراف (SFT) → التعلم المعزز (RL).
DeepSeek R1: يركز على نهج تدريب يركز على التعلم المعزز، بدءًا من الضبط الدقيق البارد ودمج مراحل متعددة من التعلم المعزز لتحسين الاستدلال.

أداء المقاييس
DeepSeek V3: أداء عام قوي عبر المقاييس، محققًا 87.4% على MMLU و 90.0% على MATH-500.
DeepSeek R1: يتفوق في المهام كثيفة الاستدلال، بنسبة 96.3% على Codeforces و 97.3% على MATH-500، متجاوزًا V3 في التحديات المتخصصة.

التطبيقات
DeepSeek V3: نموذج متعدد الاستخدامات للأغراض العامة مناسب لفهم اللغة الطبيعية والبرمجة وتوليد النصوص، قابل للتطبيق على نطاق واسع في التعليم وإنشاء المحتوى وأتمتة الأعمال.
DeepSeek R1: محسّن لمهام الاستدلال المتقدمة مثل الاستدلال المنطقي وحل المشكلات متعددة الخطوات، مثالي للرعاية الصحية والمالية والخدمات القانونية وحالات الاستخدام الأخرى الخاصة بالصناعة.

إذا كنت تبحث عن تقييم V3 و R1 من DeepSeek في حالات الاستخدام الخاصة بك — عند التسجيل، تمنحك Novita AI رصيدًا بقيمة 0.5 دولار لتبدأ!

لقد أحدثت نماذج DeepSeek V3 و R1 ثورة في مشهد الذكاء الاصطناعي. تمثل نماذج اللغة المتقدمة هذه معالم هامة في قدرات معالجة اللغة الطبيعية والاستدلال. تقدم هذه المقالة مقارنة مفصلة بين DeepSeek V3 و DeepSeek R1، تستكشف ميزاتهما وأدائهما وتطبيقاتهما العملية.

مقدمة أساسية عن النموذج

لبدء مقارنتنا، نفهم أولاً الخصائص الأساسية لكل نموذج.

DeepSeek V3

  • تاريخ الإصدار: 27 ديسمبر 2024
  • حجم النموذج:
  • الميزات الرئيسية:
    • حجم النموذج: 671 مليار معامل (37 مليار نشط/رمز)
    • المجزئ اللغوي: مجزئ متعدد اللغات قائم على SentencePiece
    • اللغات المدعومة: يركز على الصينية والإنجليزية واليابانية
    • متعدد الوسائط: نص فقط
    • نافذة السياق: 128 ألف رمز
    • صيغ التخزين: FP8/BF16 للاستنتاج
    • الهندسة: خليط من الخبراء (MoE) + انتباه كامن متعدد الرؤوس
    • طريقة التدريب: التدريب المسبق → الضبط الدقيق الخاضع للإشراف (SFT) → التعلم المعزز (RL)
    • بيانات التدريب: 14.8 تريليون رمز للتدريب المسبق

DeepSeek R1

  • تاريخ الإصدار: 21 يناير 2025
  • حجم النموذج:
  • الميزات الرئيسية:
    • حجم النموذج: 671 مليار معامل (37 مليار نشط/رمز)
    • المجزئ اللغوي: مجزئ محسّن مع علامات تأمل ذاتي
    • اللغات المدعومة: متعدد اللغات مع تكيف ثقافي
    • متعدد الوسائط: نص فقط
    • نافذة السياق: 128 ألف رمز
    • صيغ التخزين: دعم القياس الكمي Q8/Q5
    • الهندسة: خليط من الخبراء (MoE) + مسار تدريب معزز بالتعلم المعزز
    • طريقة التدريب: مبني على قاعدة V3 مع مسار RL (SFT → RL → SFT → RL)
    • بيانات التدريب: قاعدة V3 + بيانات تحسين RL

إنشاء r1

المصدر

مقارنة النماذج

deepseek v3 مقابل deepseek r1

أوجه التشابه:

  • كلاهما بنفس حجم النموذج (671 مليار معامل، 37 مليار معامل نشط لكل رمز).
  • كلاهما يستخدم هندسة خليط الخبراء (MoE).
  • كلاهما نماذج متعددة اللغات تتفوق في الإنجليزية والصينية.

الاختلافات الرئيسية:

  • طرق التدريب: يستخدم V3 مسارًا تقليديًا من التدريب المسبق والضبط الدقيق الخاضع للإشراف (SFT) والتعلم المعزز (RL). في المقابل، يركز R1 على نهج يركز على RL، يتضمن الضبط الدقيق البارد وآليات المكافأة لتعزيز قدرات الاستدلال.

rl مقابل v3

مقارنة السرعة

إذا كنت ترغب في اختباره بنفسك، يمكنك بدء تجربة مجانية على موقع Novita AI.

ابدأ تجربة مجانية

جرّب DeepSeek V3 الآن!

مقارنة السرعة

سرعة إخراج v3 و r1

زمن استجابة v3 و r1

trt لـ v3 و r1

المصدر من artificialanalysis

مقارنة التكلفة

سعر v3 و r1

المصدر من artificialanalysis

يتفوق DeepSeek R1 على DeepSeek V3 في سرعة الإخراج، لكن لديه وقت استجابة إجمالي أطول. أسعار الإدخال والإخراج لـ DeepSeek R1 أعلى بكثير من أسعار DeepSeek V3.

مقارنة المقاييس

بعد أن وضعنا الخصائص الأساسية لكل نموذج، دعنا نتعمق في أدائهما عبر مختلف المقاييس. ستساعد هذه المقارنة في توضيح نقاط قوتهما في المجالات المختلفة.

المعيار DeepSeek-R1 (%) DeepSeek-V3 (%)
Codeforces 96.3 63.6
GPQA Diamond 71.5 62.1
MATH-500 97.3 90.0
MMLU 90.8 87.4

تشير هذه النتائج إلى أن DeepSeek-R1 محسّن بشكل أفضل للمهام كثيفة الاستدلال والمتخصصة (مثل Codeforces و MATH-500)، بينما DeepSeek-V3 يقدم أداءً قويًا، وإن كان أقل قليلاً، عبر هذه المقاييس.

إذا كنت تريد رؤية المزيد من المقارنات، يمكنك الاطلاع على هذه المقالات:

التطبيقات وحالات الاستخدام

DeepSeek V3

  • مصمم لمجموعة واسعة من المهام، بما في ذلك فهم اللغة الطبيعية والبرمجة وحل المشكلات الأساسية.
  • قابل للتطبيق عبر صناعات مثل التعليم وإنشاء المحتوى وأتمتة الأعمال.
  • يتفوق في مجالات مثل توليد النصوص وإكمال الأكواد والاستدلال الرياضي.
  • نموذج متعدد الاستخدامات للأغراض العامة مناسب لمختلف التطبيقات.

DeepSeek R1

  • مصمم خصيصًا للمهام التي تتطلب استدلالًا متقدمًا واستدلالًا منطقيًا وحل مشكلات رياضية.
  • مثالي لمواجهة التحديات المعقدة الخاصة بالصناعة في مجالات مثل الرعاية الصحية والمالية والخدمات القانونية.
  • فعال بشكل خاص للمهام التي تتطلب استدلالًا ممتدًا لسلسلة الأفكار (CoT)، مثل تشخيص المشكلات المعقدة وتحليل السيناريوهات متعددة الخطوات وتجميع الرؤى من مجموعات البيانات الكبيرة.

إمكانية الوصول والنشر عبر Novita AI

Novita AI هي منصة سحابية للذكاء الاصطناعي تقدم للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة التطبيقات البسيطة الخاصة بنا، مع توفير سحابة GPU موثوقة وبأسعار معقولة للبناء والتوسع.

الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج

سجل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

تسجيل الدخول والوصول إلى مكتبة النماذج

الخطوة 2: اختر نموذجك

تصفح الخيارات المتاحة واختر النموذج الذي يناسب احتياجاتك.

اختيار النماذج

الخطوة 3: ابدأ تجربتك المجانية

ابدأ تجربتك المجانية لاستكشاف إمكانيات النموذج المختار.

تجربة مجانية

الخطوة 4: احصل على مفتاح API الخاص بك

للمصادقة مع واجهة برمجة التطبيقات، سنزودك بمفتاح API جديد. بالدخول إلى صفحة الإعدادات، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

الحصول على مفتاح API

الخطوة 5: تثبيت API

قم بتثبيت API باستخدام مدير الحزم الخاص بلغة البرمجة الخاصة بك.

تثبيت API

بعد التثبيت، قم باستيراد المكتبات اللازمة إلى بيئة التطوير الخاصة بك. قم بتهيئة API باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال على استخدام واجهة برمجة تطبيقات الدردشة لمستخدمي Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "deepseek/deepseek_v3"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=&#91;
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices&#91;0].delta.content or "", end="")
else:
    print(chat_completion_res.choices&#91;0].message.content)
  
  

عند التسجيل، تمنحك Novita AI رصيدًا بقيمة 0.5 دولار لتبدأ!

إذا نفد الرصيد المجاني، يمكنك الدفع لمواصلة الاستخدام.

DeepSeek V3 و DeepSeek R1 هما نموذجان قويان للغة مع نقاط قوة مميزة. DeepSeek V3 هو نموذج متعدد الاستخدامات للأغراض العامة معروف بكفاءته وأدائه القوي في مختلف المهام. بينما DeepSeek R1 هو نموذج متخصص محسّن للاستدلال المتقدم. يعتمد الاختيار بينهما على المتطلبات المحددة للتطبيق. كلا النموذجين يمثلان تقدمًا كبيرًا في هذا المجال، ويتحديان النماذج الحالية بأدائهما وكفاءتهما وإمكانية الوصول مفتوحة المصدر.

الأسئلة الشائعة

ما الفرق الرئيسي بين DeepSeek V3 و R1؟

DeepSeek V3 هو نموذج للأغراض العامة، بينما R1 مصمم خصيصًا لمهام الاستدلال المتقدم.

هل تحتاج هذه النماذج إلى أجهزة خاصة؟

نعم، كلا النموذجين كبيران ويتطلبان أجهزة عالية الأداء، خاصة وحدات معالجة الرسومات (GPU) ذات ذاكرة وصول عشوائي افتراضية (VRAM) كبيرة.

كيف يتم تدريب النماذج؟

يتم تدريب DeepSeek V3 مسبقًا على 14.8 تريليون رمز. يعتمد DeepSeek R1 على DeepSeek V3، باستخدام الضبط الدقيق والتعلم المعزز لقدرات الاستدلال.

Novita AI هي المنصة السحابية الشاملة التي تعزز طموحاتك في الذكاء الاصطناعي. واجهات برمجة تطبيقات متكاملة، بدون خادم، مثيل GPU — الأدوات الفعالة من حيث التكلفة التي تحتاجها. تخلص من البنية التحتية، ابدأ مجانًا، وحقق رؤيتك في الذكاء الاصطناعي.

قراءات موصى بها