DeepSeek V3 و R1 المحدثان: سياق وإخراج 160 ألف رمز، الآن بسعر أقل

DeepSeek V3 و R1 المحدثان: سياق وإخراج 160 ألف رمز، الآن بسعر أقل

في Novita AI، يسعدنا الإعلان عن ترقية نموذج DeepSeek لدينا لدعم طول محتوى يبلغ 160 ألف رمز، وهو تحسين كبير مقارنة بالحد السابق البالغ 128 ألف رمز. تعني هذه الترقية أنه يمكنك الآن معالجة وتحليل مجموعات بيانات أكبر في جلسة واحدة، مما يوفر الوقت ويحسن الكفاءة. لفترة محدودة، يمكن للمستخدمين الجدد الحصول على 10 دولارات من الرصيد المجاني لاستكشاف نماذج DeepSeek المحدثة ومختلف واجهات برمجة التطبيقات LLM الأخرى على Novita AI.

DeepSeek-R1-0528

مقدمة

تم إطلاق DeepSeek R1 0528 في 28 مايو 2025 كنموذج مفتوح المصدر كبير يحتوي على حوالي 685 مليار معامل. يستخدم بنية خبراء مختلطين (MoE)، حيث ينشط حوالي 37 مليار معامل لكل رمز أثناء الاستدلال. يدعم النموذج طول سياق أقصى يبلغ 128 ألف رمز.

يتفوق النموذج في المحادثة، الاستدلال، البرمجة، الرياضيات، واستدعاء الدوال، مع دعم إضافي لإخراج JSON وواجهات استدعاء الدوال، مما يعزز بشكل كبير قدرته على التعامل مع المهام المعقدة. تم تدريبه على أكثر من 10 تريليون رمز، بما في ذلك المحتوى الويب، الشفرة البرمجية، البيانات الرياضية، والمستندات، مع تركيز قوي على القدرات ثنائية اللغة باللغتين الإنجليزية والصينية.

تضمن التدريب استخدام التعلم التعزيزي التقليدي من التغذية الراجعة البشرية (RLHF) وطرق الضبط الدقيق، بالإضافة إلى موارد حاسوبية كبيرة وتحسينات خوارزمية في المراحل اللاحقة. يعطي هذا النهج الأولوية لـالدقة والموثوقية على الكفاءة، مما يجعل النموذج مناسبًا تمامًا لـتطبيقات المؤسسات، خاصة تلك التي تتطلب استدلالًا معقدًا ودقة عالية.

المعايير

DeepSeek R1 0528 benchmark comparison

DeepSeek-V3-0324

مقدمة

تم إطلاق DeepSeek V3 0324 في 25 مارس 2025 كنموذج مفتوح المصدر كبير يحتوي على حوالي 671 مليار معامل، وينشط حوالي 37 مليار معامل لكل رمز أثناء الاستدلال. يستخدم بنية خبراء مختلطين (MoE) ويدعم طول سياق أقصى يبلغ 160 ألف رمز، مما يجعله قادرًا للغاية على معالجة المدخلات فائقة الطول وتوليد مخرجات ممتدة.

صمم النموذج ليتفوق في مهام مثل المحادثات متعددة الأدوار، الاستدلال العميق، توليد الشفرات البرمجية، وحل المشكلات الرياضية. دعم اللغات المتعددة المحسن، خاصة للغة الصينية، وقدرته النصية متعددة الوسائط تزيد من تنوعه. تتضمن بيانات التدريب 14.8 تريليون رمز من مصادر متنوعة، مثل محتوى الويب، قواعد الشفرات، والمستندات التقنية، مما يضمن قاعدة معرفية قوية للتطبيقات المعقدة.

يستخدم DeepSeek V3 0324 تقنيات ما قبل التدريب والضبط الدقيق ما بعد التدريب المصممة خصيصًا لحالات الاستخدام المحددة. هذا النهج الشامل، إلى جانب الموارد الحاسوبية الواسعة، يعطي الأولوية للدقة والترابط والموثوقية، مما يجعل النموذج مثاليًا للصناعات التي تتطلب توليد محتوى طويل وحل مشكلات معقدة وأداء على مستوى المؤسسات.

المعايير

DeepSeek V3 0324 benchmark comparison

طول المحتوى

ما هو طول المحتوى؟

في سياق نماذج الذكاء الاصطناعي مثل DeepSeek، يشير طول المحتوى إلى الحد الأقصى لعدد الرموز (كلمات، علامات ترقيم، أو رموز) التي يمكن للنموذج معالجتها وتوليدها في تفاعل واحد. يحدد مقدار المدخلات التي يمكن للنموذج فهمها في المرة الواحدة ومقدار المخرجات التي يمكنه إنتاجها. تتيح نافذة سياق أكبر للنموذج معالجة مدخلات أطول ودمج كمية أكبر من المعلومات في كل مخرجات.

كيف يؤثر طول المحتوى على الأداء؟

يؤثر طول المحتوى بشكل كبير على قدرة النموذج على:

  • فهم السياق: تسمح نوافذ السياق الأطول للنموذج بالرجوع إلى مزيد من المعلومات من المدخلات، مما يقلل من فرص فقدان التفاصيل الهامة.
  • توليد مخرجات مترابطة: من خلال الوصول إلى السياق الكامل، يمكن للنموذج إنتاج ردود تحافظ على الاتساق المنطقي عبر المخرجات الأطول.
  • تمكين الاستدلال المعقد: المهام التي تتطلب استدلالًا متعدد الخطوات أو تتبع الحالات التاريخية، مثل البرمجة أو التحليل الفني أو البحث المتعمق، تستفيد بشكل كبير من السياق الممتد.

فوائد توسيع الحد إلى 160 ألف رمز

مع الترقية الأخيرة، يدعم كل من DeepSeek-V3-0324 وDeepSeek-R1-0528 الآن حد 160 ألف رمز، وهي قفزة كبيرة مقارنة بنافذة السياق السابقة البالغة 128 ألف رمز. يجلب هذا التوسع العديد من المزايا الرئيسية:

  1. يدعم المحادثات فائقة الطول: تتيح نافذة السياق الممتدة إجراء حوارات متعددة الأدوار بسلاسة دون فقدان تتبع التفاعلات السابقة، مما يجعلها مثالية للمهام التي تتطلب اتساقًا وذاكرة طويل الأمد.
  2. يسهل تحليل العوامل المتعمق: يمكن للعوامل الآن تحليل مجموعات بيانات أكبر أو إجراء استدلال أعمق على فترات ممتدة، مما يفتح إمكانيات جديدة لتطبيقات مثل ذكاء الأعمال أو البحث العلمي.
  3. يتيح تطبيقات المخرجات الطويلة: المهام مثل توليد الشفرات البرمجية، تلخيص المستندات، أو توليد التقارير التفصيلية يمكنها الآن التعامل مع مدخلات أكبر وأكثر تعقيدًا، مما يوفر نتائج شاملة في مخرجات واحدة.

من خلال توسيع طول المحتوى، أصبح DeepSeek الآن مجهزًا بشكل أفضل للتعامل مع متطلبات سير العمل الحديثة، مما يجعله أداة قوية للمستخدمين عبر الصناعات المتنوعة.

الوصول إلى DeepSeek عبر Novita AI

الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج

سجل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

تسجيل الدخول والوصول إلى مكتبة النماذج

الخطوة 2: اختر النموذج الخاص بك

تصفح الخيارات المتاحة واختر النموذج الذي يناسب احتياجاتك.

اختر نموذجك

الخطوة 3: ابدأ تجربتك المجانية

ابدأ تجربتك المجانية لاستكشاف قدرات النموذج المحدد.

ابدأ تجربة مجانية على DeepSeek R1 0528

جرب DeepSeek الآن

الخطوة 4: احصل على مفتاح API الخاص بك

للمصادقة مع واجهة برمجة التطبيقات، سنزودك بمفتاح API جديد. بالدخول إلى صفحة “الإعدادات”، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

الحصول على مفتاح API

الخطوة 5: تثبيت واجهة برمجة التطبيقات

قم بتثبيت واجهة برمجة التطبيقات باستخدام مدير الحزم الخاص بلغة البرمجة الخاصة بك.

تثبيت واجهة برمجة التطبيقات

بعد التثبيت، قم باستيراد المكتبات اللازمة في بيئة التطوير الخاصة بك. قم بتهيئة واجهة برمجة التطبيقات باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال على استخدام واجهة chat completions لمستخدمي Python للوصول إلى DeepSeek R1 0528.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="session_r5eB9eC3oBfDyuGn69eevTLAudts6AFa3JeHeml91oVyVe6uZnGUmAh7aO9rZxUSRocPWUBszQaiC39g4VGiAg==",
)

model = "deepseek/deepseek-r1-0528"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

تقدم Novita AI كلاً من DeepSeek R1 0528 و DeepSeek V3 0324 مع طول سياق ممتد، مما يسمح لك بالتعامل مع المحادثات الأطول والمشاريع الأكثر تعقيدًا. مع سعر DeepSeek R1 0528 البالغ 0.7 دولار / 2.5 دولار لكل 1 مليون رمز إدخال/إخراج و DeepSeek V3 0324 بسعر أكثر ملاءمة يبلغ 0.28 دولار / 1.14 دولار لكل 1 مليون رمز، يمكنك الوصول إلى أداء ذكاء اصطناعي متطور دون تجاوز الميزانية. لفترة محدودة، يمكن للمستخدمين الجدد الحصول على 10 دولارات من الرصيد المجاني لاستكشاف نماذج DeepSeek المحدثة ومختلف واجهات برمجة التطبيقات LLM الأخرى على Novita AI.

الأسئلة الشائعة

ما هو Deepseek V3 0324؟

Deepseek V3 0324 هو نموذج لغة كبير حديث من DeepSeek، مصمم للمحادثة العامة والفهم والاستدلال المتقدم.

كيف يفيد طول السياق الممتد مشاريع البرمجة؟

مع السياق الممتد، يمكنك مشاركة قواعد الشفرات بأكملها، والحفاظ على السياق عبر ملفات متعددة، والعمل على مهام إعادة الهيكلة المعقدة دون فقدان تتبع التبعيات والعلاقات بين الأجزاء المختلفة من شفرتك. يحسن هذا بشكل كبير قدرة الذكاء الاصطناعي على تقديم اقتراحات دقيقة وذات صلة بالسياق.

ما هو طول السياق الجيد لنموذج LLM؟

معظم التطبيقات، يوفر 32 ألف إلى 128 ألف رمز أداءً ممتازًا، بينما يضمن طول السياق المحدث 160 ألف رمز من Novita AI أنه يمكنك التعامل حتى مع المستندات الأكثر تعقيدًا والمحادثات الممتدة دون أي قيود.

حول Novita AI

Novita AI هي منصة سحابية للذكاء الاصطناعي تقدم للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة التطبيقات البسيطة لدينا، مع توفير سحابة GPU ميسورة التكلفة وموثوقة للبناء والتوسع.