كيفية نشر DeepSeek-R1-0528-Qwen3-8B على مثيلات GPU من Novita AI

كيفية نشر DeepSeek-R1-0528-Qwen3-8B على مثيلات GPU من Novita AI

ماذا لو كان بإمكانك تشغيل نموذج بمعاملات 8 مليار يتفوق على نماذج أكبر منه بـ 30 مرة؟

يقدم DeepSeek-R1-0528-Qwen3-8B أداءً استدلاليًا رائدًا، حيث يضاهي النماذج ذات 235 مليار معامل في المهام الرياضية المعقدة مع العمل بكفاءة على بطاقة RTX 4090 واحدة.

يشرح لك هذا الدليل كيفية نشر هذا النموذج المغير لقواعد اللعبة على Novita AI في دقائق.

ما هو DeepSeek-R1-0528-Qwen3-8B

DeepSeek-R1-0528-Qwen3-8B هو نموذج استدلالي متطور تم إنشاؤه عن طريق تقطير قدرات التفكير المتسلسل من DeepSeek-R1-0528 في نموذج Qwen3 8B الأساسي. أنتج هذا النهج المبتكر نموذجًا مفتوح المصدر من أحدث الإصدارات يحقق أداءً ملحوظًا في المعايير الرياضية والاستدلالية، بما في ذلك AIME 2024 حيث يتفوق على Qwen3 8B بنسبة +10.0% ويضاهي أداء النموذج الأكبر بكثير Qwen3-235B-thinking.

يظهر النموذج قدرات استثنائية عبر مقاييس تقييم متنوعة، مسجلًا 86.0 في AIME 24، و 76.3 في AIME 25، و 61.5 في HMMT Feb 25. ما يجعل هذا النموذج قيمًا بشكل خاص هو قدرته على تقديم أداء استدلالي مماثل للنماذج الأكبر بكثير مع الحفاظ على كفاءة وقابلية نشر نموذج بمعاملات 8 مليار.

معيار أداء DeepSeek-R1-0528-Qwen3-8B

لماذا تشغيل DeepSeek-R1-0528-Qwen3-8B على مثيلات GPU من Novita AI؟

1. ميزة سعرية كبيرة ونماذج تسعير مرنة

تقدم Novita AI أسعارًا تنافسية في سوق حوسبة GPU، مما يجعل نماذج الذكاء الاصطناعي المتقدمة مثل DeepSeek-R1-0528-Qwen3-8B في متناول الباحثين والشركات والمطورين على أي نطاق.

اختر بين التسعير حسب الطلب والاشتراك بناءً على أنماط استخدامك. بالنسبة لـ DeepSeek-R1-0528-Qwen3-8B الذي يعمل على RTX 4090:

  • حسب الطلب: 0.35 دولار/ساعة - مناسب للاختبار وأعباء العمل المتغيرة
  • 1-5 أشهر: 226.80 دولار/شهر (خصم 10%) - مشاريع متوسطة المدى
  • 6-11 شهرًا: 206.64 دولار/شهر (خصم 18%) - دورات تطوير ممتدة
  • 12 شهرًا: 189.00 دولار/شهر (خصم 25%) - توفير أكبر للالتزامات طويلة الأجل

يمكن أن يوفر لك الاشتراك السنوي مئات الدولارات مع ضمان توفر الموارد. تعرف على المزيد حول نماذج التسعير.

2. خيارات GPU متعددة لتحسين الأداء

توفر Novita AI خيارات GPU شاملة تناسب احتياجاتك الحاسوبية وميزانيتك:

  • RTX 3090 24GB: فعال من حيث التكلفة للتطوير والاختبار
  • RTX 4090 24GB: موصى به لـ DeepSeek-R1-0528-Qwen3-8B - توازن بين الأداء والتكلفة
  • RTX 5090 32GB
  • RTX 6000 Ada 48GB: ذاكرة محسّنة لأطوال سياق أطول
  • L40S 48GB: أداء على المستوى الاحترافي مع سعة ذاكرة ممتدة
  • A100 SXM 80GB: حوسبة عالية الأداء مع نطاق ترددي كبير للذاكرة
  • H100 SXM 80GB: أداء على مستوى المؤسسات لنشر الإنتاج

3. قوالب جاهزة للاستخدام ومرونة مخصصة

القوالب المهيئة مسبقًا للنماذج الشائعة مثل DeepSeek-R1-0528-Qwen3-8B تلغي تعقيد الإعداد اليدوي، بما في ذلك تكوينات الحاويات المحسّنة، ومتغيرات البيئة، ومعلمات النشر المختبرة. يمكن للمستخدمين المتقدمين إنشاء قوالب مخصصة بالكامل بتكوينات متخصصة ونصوص نشر شخصية، مما يضمن سهولة الاستخدام للمبتدئين والتخصيص الكامل للمطورين ذوي الخبرة.

4. شبكة نشر عالمية

انشر مثيلات GPU أقرب إلى مستخدميك من خلال شبكة Novita AI العالمية التي تضم 15 منطقة في جميع أنحاء الأمريكتين (الولايات المتحدة، كندا، البرازيل)، وآسيا والمحيط الهادئ (اليابان، سنغافورة، الهند، الإمارات العربية المتحدة، هونغ كونغ)، وأوروبا (ألمانيا، المملكة المتحدة). تضمن هذه البنية التحتية العالمية تقليل زمن الوصول والأداء الموثوق لنشر نموذج DeepSeek-R1-0528-Qwen3-8B الخاص بك، مما يوفر وصولاً معتمدًا بغض النظر عن موقع المستخدم.

كيفية نشر DeepSeek-R1-0528-Qwen3-8B على Novita AI

الخطوة 1: اختيار القالب

حدد قالب DeepSeek-R1-0528-Qwen3-8B من مكتبة النماذج. اختر RTX 4090 واحدة كنوع GPU الخاص بك وانقر على Deploy.

اختيار 4090

الخطوة 2: تأكيد المعلمات

راجع معلمات النشر المعروضة على شاشة التكوين. تحقق من صحة جميع الإعدادات وانقر على Next للمتابعة.

استخدام القالب

الخطوة 3: نشر المثيل

انقر على Deploy لبدء عملية إنشاء المثيل. سيبدأ النظام في توفير مثيل GPU الخاص بك.

نشر القالب

الخطوة 4: مراقبة تقدم النشر

انتقل إلى Instance Management للوصول إلى لوحة التحكم. تتيح لك هذه اللوحة تتبع حالة النشر في الوقت الفعلي.

الخطوة 5: عرض حالة سحب الصورة

انقر على مثيلك المحدد لمراقبة تقدم تنزيل صورة الحاوية. قد تستغرق هذه العملية عدة دقائق حسب ظروف الشبكة.

الخطوة 6: تتبع تنزيل النموذج

بعد بدء تشغيل المثيل، سيبدأ في سحب النموذج. انقر على “Logs” –> “Instance Logs” لمراقبة تقدم تنزيل النموذج.

الخطوة 7: التحقق من نجاح النشر

ابحث عن الرسالة "Application startup complete." في سجلات المثيل. يشير ذلك إلى أن عملية النشر قد اكتملت بنجاح.

الخطوة 8: الحصول على عنوان URL للوصول

انقر على “Connect”، ثم انقر على –> “Connect to HTTP Service [Port 8000]”. نظرًا لأن هذه خدمة API، ستحتاج إلى نسخ العنوان.

عنوان URL للموقع

الخطوة 9: الوصول إلى نموذجك المنشور

لإرسال الطلبات إلى نموذجك، يرجى استبدال http://7a65a32b51e37482-8000.jp-tyo-1.gpu-instance.novita.ai بعنوانك المكشوف الفعلي. انسخ الكود التالي للوصول إلى نموذجك الخاص!

# استدعاء الخادم باستخدام curl:
curl -X POST "http://7a65a32b51e37482-8000.jp-tyo-1.gpu-instance.novita.ai/v1/chat/completions" \
        -H "Content-Type: application/json" \
        --data '{
                "model": "deepseek-ai/DeepSeek-R1-0528-Qwen3-8B",
                "messages": [
                        {
                                "role": "user",
                                "content": "What is the capital of France?"
                        }
                ]
        }'
{"id":"chatcmpl-56d12c91edbb46fcb93ccbbc0ecddd2c","object":"chat.completion","created":1748588145,"model":"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B","choices":[{"index":0,"message":{"role":"assistant","reasoning_content":null,"content":" thinking\
Okay, the user is asking for the capital of France. Let me start by recalling the basic answer. Paris is definitely the correct response, so I'll start with that.\
\
But why is the user asking this? They might be a student preparing for a test, or maybe someone traveling who needs to know the main city for planning. Alternatively, they could be testing my knowledge. But since it's a straightforward question, I'll focus on providing accurate information.\
\
Wait, maybe they need more context. Should I mention some points of interest to add value? Like Eiffel Tower or Louvre. That could help if they're interested in tourism or education. \
\
I should check if there's any recent political changes or administrative updates but nothing seems off with Paris' status as a capital. Alright, keep it simple but informative. Let me structure the answer first, then decide on the optional details. \
\
Also, considering the user might not want a long answer. But including key landmarks might make it more engaging. They didn't ask for historical info, so maybe just stick to the status and one or two unique facts. \
\
Yes, \"city of love\" is a common nickname, so that adds a nice touch. Alright, final answer will confirm Paris, mention the nicknames, and list two landmarks to cover possible interests without being overwhelming.\
 response\
The capital of France is **Paris**.","tool_calls":[]},"logprobs":null,"finish_reason":"stop","stop_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":294,"completion_tokens":284,"prompt_tokens_details":null},"prompt_logprobs":null}

قم بتكوين عنوان API في تطبيقاتك مثل Chatbox، وستحصل على مساعدك الشخصي!

Novita AI هي منصة سحابية للذكاء الاصطناعي تقدم للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة تطبيقات بسيطة، مع توفير سحابة GPU ميسورة التكلفة وموثوقة للبناء والتوسع.