DeepSeek-R1-0528 و DeepSeek-R1-0528-Qwen3-8B متوفران الآن على Novita AI

ديب سيك-R1-0528-Qwen3-8B

أطلقت شركة DeepSeek نموذجين رائدين - DeepSeek-R1-0528 و DeepSeek-R1-0528-Qwen3-8B - وكلاهما متاح الآن على Novita AIمنصة سحابية للذكاء الاصطناعي تُتيح للمطورين نشر نماذج الذكاء الاصطناعي بسهولة عبر واجهة برمجة التطبيقات (API) المباشرة. تُقدم هذه النماذج قدرات استدلال استثنائية بأسعار تنافسية، مُقدمةً أداءً أفضل بكثير من سابقاتها.

Novita AI تقدم كلا الطرازين DeepSeek-R1-0528 بأسعار تنافسية مع تسعير شفاف للدفع مقابل الاستخدام:

ديب سيك-R1-0528 (النموذج الكامل):

  • رموز الإدخال: 0.7 دولار لكل مليون رمز
  • رموز الإخراج: 2.5 دولار لكل مليون رمز

ديب سيك-R1-0528-Qwen3-8B (نموذج 8B الفعال):

  • رموز الإدخال: 0.06 دولار لكل مليون رمز
  • رموز الإخراج: 0.09 دولار لكل مليون رمز

ما هو DeepSeek-R1-0528؟

خضع نموذج DeepSeek R1 لتحديث طفيف، وهو الإصدار الحالي DeepSeek-R1-0528. في هذا التحديث الأخير، حسّن DeepSeek R1 قدراته على عمق التفكير والاستدلال بشكل ملحوظ من خلال الاستفادة من موارد حسابية متزايدة وإدخال آليات تحسين خوارزمية خلال مرحلة ما بعد التدريب.

يُظهر النموذج أداءً متميزًا في مختلف تقييمات المعايير، بما في ذلك الرياضيات والبرمجة والمنطق العام. ويقترب أداؤه الإجمالي الآن من أداء النماذج الرائدة، مثل O3 وGemini 2.5 Pro.

التحسينات الرئيسية في DeepSeek-R1-0528

دى "¹ تحسين أداء المعايير عبر مهام الرياضيات والترميز والاستدلال
دى "¹ قدرات الواجهة الأمامية المحسنة للحصول على تجربة مستخدم أفضل
دى "¹ انخفاض الهلوسة للحصول على مخرجات أكثر موثوقية
دى "¹ يدعم إخراج JSON واستدعاء الوظيفة للتكامل السلس

عمق التفكير المعزز

مقارنةً بالإصدار السابق، يُظهر النموذج المُحسّن تحسينات ملحوظة في معالجة مهام التفكير المعقدة. على سبيل المثال، في اختبار AIME 2025، زادت دقة النموذج من 70% في الإصدار السابق إلى 87.5% في الإصدار الحالي.

ينبع هذا التقدم من تعزيز عمق التفكير أثناء عملية الاستدلال: في مجموعة اختبار AIME، استخدم النموذج السابق متوسط ​​12 ألف رمز لكل سؤال، بينما يستخدم الإصدار الجديد متوسط ​​23 ألف رمز لكل سؤال.

الأداء التنافسي ضد رواد الصناعة

يُظهر DeepSeek-R1-0528 أداءً رائعًا عند مقارنته بالنماذج الرائدة في الصناعة عبر العديد من المعايير الصعبة:

اختبار أداء DeepSeek R1 0528

DeepSeek-R1 مقابل DeepSeek-R1-0528

أداء التفكير الرياضي

مؤشرديب سيك R1ديب سيك R1-0528تحسين
AIME 2024 (النجاح في عام واحد)79.891.411.6+
AIME 2025 (النجاح في عام واحد)70.087.517.5+
HMMT 2025 (النجاح في عام واحد)41.779.437.7+
CNMO 2024 (النجاح في عام واحد)78.886.98.1+

تحسين أداء الترميز

مؤشرديب سيك R1ديب سيك R1-0528تحسين
LiveCodeBench (Pass@1)63.573.39.8+
Codeforces-Div1 (التقييم)15301930400+
تم التحقق من SWE (تم الحل)49.257.68.4+
أيدر متعدد اللغات (متوافق)53.371.618.3+

مهام التفكير العام

مؤشرديب سيك R1ديب سيك R1-0528تحسين
MMLU Redux (EM)92.993.40.5+
MMLU-Pro (EM)84.085.01.0+
GPQA-Diamond (Pass@1)71.581.09.5+
SimpleQA (صحيح)30.127.8-2.3
الإطارات (ملحق)82.583.00.5+
الامتحان الأخير للبشرية (النجاح في الصف الأول)8.517.79.2+

إمكانيات تكامل الأدوات الجديدة

يقدم DeepSeek-R1-0528 إمكانيات محسنة في استدعاء الوظائف وتكامل الأدوات:

  • BFCL_v3_MultiTurn (Acc): 37.0٪
  • مقعد تاو (تمريرة @ 1): 53.5% (شركات الطيران) / 63.9% (التجزئة)

DeepSeek-R1-0528-Qwen3-8B: التميز المدمج

استخلصت DeepSeek خوارزمية التفكير المتسلسل لـ DeepSeek-R1-0528 لإنشاء DeepSeek-R1-0528-Qwen3-8B انطلاقًا من قاعدة Qwen3 8B. يحقق هذا النموذج أداءً متطورًا (SOTA) بين النماذج مفتوحة المصدر على AIME 2024، متجاوزًا Qwen3-8B بنسبة 10.0%، ومطابقًا لأداء Qwen3-235B.

يوضح هذا أن سلسلة الأفكار من DeepSeek-R1-0528 لها أهمية كبيرة لكل من البحث الأكاديمي حول نماذج التفكير والتطوير الصناعي الذي يركز على النماذج صغيرة النطاق.

التحليل التنافسي باستخدام النماذج الرائدة

الموديلAIME 24AIME 25HMMT 25 فبرايرالماس من GPQAبرنامج LiveCodeBench
Qwen3-235B-A22B85.781.562.571.166.5
Qwen3-32B81.472.9-68.4-
Qwen3-8B76.067.3-62.0-
فاي-4-المنطق-زائد-14ب81.378.053.669.3-
الجوزاء 2.5-تفكير سريع 052082.372.064.282.862.3
o3-mini (متوسط)79.676.753.376.865.9
ديب سيك-R1-0528-Qwen3-8B86.076.361.561.160.5

تحسينات الاستخدام والتفاصيل الفنية

ميزات الاستخدام المحسنة

بالمقارنة مع الإصدارات السابقة من DeepSeek-R1، تتضمن توصيات الاستخدام الخاصة بـ DeepSeek-R1-0528 التحسينات التالية:

  • دعم موجه النظام:على عكس الإصدارات السابقة، يمكنك الآن استخدام مطالبات النظام لتوفير سياق وتعليمات متسقة
  • نمط التفكير التلقائي:لا يتطلب الأمر تنشيطًا يدويًا - حيث يقوم النموذج تلقائيًا بتشغيل قدراته الاستدلالية دون الحاجة إلى " \n” في بداية المخرجات

هندسة DeepSeek-R1-0528-Qwen3-8B

بنية نموذج DeepSeek-R1-0528-Qwen3-8B مطابقة لبنية Qwen3-8B، ولكنها تشترك في نفس تكوين المُرمز المُستخدم في DeepSeek-R1-0528. يمكن تشغيل هذا النموذج بنفس طريقة Qwen3-8B، ولكن يجب التأكد من أن جميع ملفات التكوين واردة من مستودع DeepSeek، وليس من مشروع Qwen3 الأصلي.

لماذا يختار المطورون Novita AI

نشر نموذج الذكاء الاصطناعي المبسط

  • لا توجد متاعب في البنية التحتية:التركيز على بناء التطبيقات، وليس إدارة الخوادم
  • الوصول الفوري للنموذج:نشر نماذج متطورة باستخدام مكالمة API واحدة
  • موثوقة الأداء:بنية تحتية على مستوى المؤسسة مع وقت تشغيل بنسبة 99.9%
  • التوفر العالمي: إمكانية الوصول بسرعة منخفضة من أي مكان في العالم

مثالي لأي مقياس

  • النماذج الأولية السريعة:اختبار الأفكار بسرعة مع إمكانية الوصول الفوري إلى النموذج
  • جاهز للإنتاج:التوسع بسلاسة من النموذج الأولي إلى الإنتاج
  • منظور التكلفه:ادفع فقط مقابل ما تستخدمه بأسعار شفافة
  • دعم المؤسسات:دعم مخصص للتطبيقات ذات الحجم الكبير

حالات الاستخدام المثالية

  • تطبيقات الذكاء الاصطناعي الرياضي:إنشاء منصات تعليمية تحقق دقة بنسبة 87.5% على AIME 2025
  • أدوات توليد التعليمات البرمجية:إنشاء مساعدين للتطوير بنسبة نجاح 73.3% على LiveCodeBench
  • منصات البحث:نشر نماذج التفكير التي تتنافس مع قادة الصناعة
  • البرامج التعليمية:تطوير تطبيقات حل المشكلات خطوة بخطوة

الشروع في العمل Novita AI

  1. حساب جديد بالثواني في Novita AI وطلبك 10 $ أرصدة مجانية
  2. اشرح ديب سيك-R1-0528 (القدرة الكاملة) أو ديب سيك-R1-0528-Qwen3-8B (فعال)
  3. احصل على مفتاح API الخاص بك من لوحة القيادة
  4. قم بإجراء أول مكالمة API الخاصة بك باستخدام نقاط النهاية المتوافقة مع OpenAI
  5. البدء في بناء مع قدرات التفكير الرائدة في الصناعة

لمستخدمي بايثون:

من openai استيراد OpenAI base_url = "https://api.novita.ai/v3/openai" api_key = " "model = "deepseek/deepseek-r1-0528" client = OpenAI(base_url=base_url, api_key=api_key, ) stream = True # or False max_tokens = 1000 response_format = { "type": "text" } chat_completion_res = client.chat.completions.create(model=model, messages=[ { "role": "user", "content": "Hi there!", } ], stream=stream, extra_body={ } ) if stream: for chunk in chat_completion_res: print(chunk.choices[0].delta.content or "", end="") else: print(chat_completion_res.choices[0].message.content)
  
  

خاتمة

توفر نماذج سلسلة DeepSeek-R1-0528 أداءً رائدًا في الصناعة بأسعار تنافسية - حيث حققت 91.4% على AIME 2024 و73.3% على LiveCodeBench مع منافسة قدرات OpenAI-o3 وGemini-2.5-Pro.

عبر Novita AIمن خلال منصة سهلة الاستخدام للمطورين، يمكنك الوصول فورًا إلى هذه النماذج المتطورة دون تعقيدات في البنية التحتية. مع أسعار شفافة، 10 $ أرصدة مجانية، وواجهة برمجة التطبيقات البديهية لدينا، ودمج التفكير العالمي في تطبيقاتك لم يكن أبدًا بهذه السهولة.

Novita AI هي عبارة عن منصة سحابية للذكاء الاصطناعي توفر للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة التطبيقات البسيطة لدينا، مع توفيرها أيضًا بأسعار معقولة وموثوقة GPU السحابة للبناء والتوسع.


اكتشف المزيد من نوفيتا

اشترك للحصول على أحدث المشاركات المرسلة إلى بريدك الإلكتروني.

اترك تعليق

انتقل إلى الأعلى

اكتشف المزيد من نوفيتا

اشترك الآن لمواصلة القراءة والوصول إلى الأرشيف الكامل.

مواصلة القراءة