ظهرت نماذج DeepSeek كخيار جذاب في مجال نماذج اللغات الكبيرة (LLM)، حيث تقدم أداءً مذهلاً بتكاليف تنافسية. ورغم قدرات هذه النماذج القوية، فإن نشرها بنجاح يتطلب بنية تحتية قوية وفعالة. يوضح هذا الدليل كيفية الاستفادة من منصة Novita AI السحابية لتحقيق النشر الأمثل لنماذج DeepSeek، مع الجمع بين الأداء العالي وفعالية التكلفة.
نظرة عامة على إصدارات النماذج
الإصدارات المقطرة
- مبنية على نماذج مفتوحة المصدر (سلسلة Qwen2.5 وLlama)
- نطاق المعاملات: 1.5B، 7B، 8B، 14B، 32B، و70B
- محسّنة للاستدلال الفعال مع الحفاظ على الأداء العالي
- مناسبة للنشر الخاص منخفض التكلفة
- سهلة النشر من خلال حل النقرة الواحدة من Novita AI
الإصدار الكامل
- DeepSeek-R1-671B
- مبني على بنية DeepSeek-V3
- يحتوي على 671 مليار معامل لتحقيق أقصى أداء
- يتطلب موارد حاسوبية كبيرة
- متاح من خلال خدمة API المحسّنة لدينا
دليل النشر
الخطوة 1: الوصول إلى منصة Novita AI
- قم بزيارة الموقع الرسمي لـ Novita AI: https://novita.ai/

[جرب Novita AI الآن](https://novita.ai/?utm_source=blogs_GPU&utm_medium=article&utm_campaign=Deploying DeepSeek Models on Novita AI Cloud Platform: A Comprehensive Guide)
- أنشئ حسابًا أو سجل الدخول إلى حسابك الحالي


الخطوة 2: الوصول إلى تكوين مثيل GPU
- انقر على “GPUs” في القائمة الرئيسية

- انقر على “Get Started” للمتابعة

الخطوة 3: اختيار وتكوين نموذج DeepSeek
في هذا الدليل، سنستخدم نموذج DeepSeek-R1-Distill-Llama-32B كمثال. يمكنك اختيار أي قالب بناءً على احتياجاتك، لكن هذا القالب يحدد المعاملات الأساسية للنموذج. ستحتاج إلى تحديد عدد وحدات GPU المطلوبة - نوصي باستخدام RTX 4090 لهذا النشر. تستخدم جميع القوالب نماذج DeepSeek الرسمية بدقة افتراضية BF16. فيما يلي التكوينات الموصى بها:
| النموذج | GPU | الدقة | العدد |
| DeepSeek-R1-Distill-Qwen-1.5B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Qwen-7B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Llama-8B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Qwen-14B | BF16 | RTX 4090 | 2 |
| DeepSeek-R1-Distill-Qwen-32B | BF16 | RTX 4090 | 4 |
| DeepSeek-R1-Distill-Llama-70B | BF16 | RTX 4090 | 8 |
اختر قالب DeepSeek-R1-Distill-Qwen-32B، واضبط عدد GPUs على 4، ثم انقر على “Deploy”.



الخطوة 4: تخصيص النشر
تأكد من معاملات القالب واملأ متغير HF_TOKEN.

يمكنك الحصول على HF_TOKEN باتباع هذه النصائح:
-
قم بزيارة huggingface.co: https://huggingface.co/
-
انقر على “Log In” في الزاوية اليمنى العليا لتسجيل الدخول، أو “Sign Up” لإنشاء حساب جديد
-
بعد تسجيل الدخول، انقر على صورتك الشخصية في الزاوية اليمنى العليا واختر “Access Tokens” من القائمة اليسرى

- انقر على “New token” لإنشاء رمز وصول جديد

- اختر “Read” لأنواع الرموز، وسمِّ الرمز (مثلاً “text”)، وانقر على “Create token” لتوليد الرمز.

- انسخ سلسلة الرمز المولّد

بعد الحصول على الرمز، أدخله في متغير البيئة HF_TOKEN في القالب. ثم انقر على “Next”.
الخطوة 5: تشغيل مثيل
انقر على “Launch Instance” لنشر البيئة التي تم تكوينها.
انتظر بضع دقائق أثناء تكوين المثيل وإدارته.

انقر على القائمة المنسدلة لعرض سجلات المثيل.

بعد بدء المثيل، سيبدأ في سحب النموذج. انقر على “Logs” --> “Instance Logs” لمراقبة تقدم تحميل النموذج.

عندما يظهر في السجل “INFO: Uvicorn running on http://0.0.0.0:8000 (Press CTRL+C to quit)”، فهذا يعني أن البدء تم بنجاح. الآن لندخل إلى نموذجك الخاص!

انقر على “Connect”، ثم انقر على --> “Connect to HTTP Service [Port 8000]”. نظرًا لأن هذه خدمة API، ستحتاج إلى نسخ العنوان.



لإرسال الطلبات إلى نموذجك الخاص، يرجى استبدال “https://f6d29cb6f71e585e-8000.us-ca-1.gpu-instance.novita.ai” بعنوانك الفعلي المكشوف. انسخ الكود التالي للوصول إلى نموذجك الخاص!
$ curl https://f6d29cb6f71e585e-8000.us-ca-1.gpu-instance.novita.ai/v1/chat/completions \
-H "Content-Type: application/json" -d '{
"model": "deepseek-ai/DeepSeek-R1-Distill-Qwen-32B",
"messages": [{"role": "user", "content": "hello"}]
}'
{"id":"chatcmpl-57b3296f87f54dd4b69cfb6d2196f48e","object":"chat.completion","created":1740711405,"model":"deepseek-ai/DeepSeek-R1-Distill-Qwen-32B","choices":[{"index":0,"message":{"role":"assistant","content":"Alright, the user said \"hello.\" That's a friendly greeting. I should respond in a welcoming manner.\
\
Maybe I can acknowledge their greeting and offer assistance.\
\
It's important to sound approachable and ready to help.\
\
I'll keep it simple and polite.\
response\
\
Hello! How can I assist you today?","tool_calls":[]},"logprobs":null,"finish_reason":"stop","stop_reason":null}],"usage":{"prompt_tokens":6,"total_tokens":70,"completion_tokens":64,"prompt_tokens_details":null},"prompt_logprobs":null}

قم بتكوين عنوان API في تطبيقاتك مثل Chatbox، وستحصل على مساعدك الشخصي!
[Novita AI](https://novita.ai/?utm_source=blogs_GPU&utm_medium=article&utm_campaign=Deploying DeepSeek Models on Novita AI Cloud Platform: A Comprehensive Guide) هي منصة سحابية للذكاء الاصطناعي تتيح للمطورين نشر نماذج الذكاء الاصطناعي بسهولة باستخدام API بسيط، كما توفر بنية تحتية لوحدات معالجة الرسوميات (GPU) ميسورة التكلفة وموثوقة للبناء والتوسع.
