نشر نماذج DeepSeek على منصة Novita AI السحابية: دليل شامل

نشر نماذج DeepSeek على منصة Novita AI السحابية: دليل شامل

ظهرت نماذج DeepSeek كخيار جذاب في مجال نماذج اللغات الكبيرة (LLM)، حيث تقدم أداءً مذهلاً بتكاليف تنافسية. ورغم قدرات هذه النماذج القوية، فإن نشرها بنجاح يتطلب بنية تحتية قوية وفعالة. يوضح هذا الدليل كيفية الاستفادة من منصة Novita AI السحابية لتحقيق النشر الأمثل لنماذج DeepSeek، مع الجمع بين الأداء العالي وفعالية التكلفة.

نظرة عامة على إصدارات النماذج

الإصدارات المقطرة

  • مبنية على نماذج مفتوحة المصدر (سلسلة Qwen2.5 وLlama)
  • نطاق المعاملات: 1.5B، 7B، 8B، 14B، 32B، و70B
  • محسّنة للاستدلال الفعال مع الحفاظ على الأداء العالي
  • مناسبة للنشر الخاص منخفض التكلفة
  • سهلة النشر من خلال حل النقرة الواحدة من Novita AI

الإصدار الكامل

  • DeepSeek-R1-671B
  • مبني على بنية DeepSeek-V3
  • يحتوي على 671 مليار معامل لتحقيق أقصى أداء
  • يتطلب موارد حاسوبية كبيرة
  • متاح من خلال خدمة API المحسّنة لدينا

دليل النشر

الخطوة 1: الوصول إلى منصة Novita AI

  1. قم بزيارة الموقع الرسمي لـ Novita AI: https://novita.ai/

لقطة شاشة لموقع novita ai

[جرب Novita AI الآن](https://novita.ai/?utm_source=blogs_GPU&utm_medium=article&utm_campaign=Deploying DeepSeek Models on Novita AI Cloud Platform: A Comprehensive Guide)

  1. أنشئ حسابًا أو سجل الدخول إلى حسابك الحالي

لقطة شاشة لموقع novita ai

لقطة شاشة لموقع novita ai

الخطوة 2: الوصول إلى تكوين مثيل GPU

  1. انقر على “GPUs” في القائمة الرئيسية

لقطة شاشة لموقع novita ai

  1. انقر على “Get Started” للمتابعة

لقطة شاشة لموقع novita ai

الخطوة 3: اختيار وتكوين نموذج DeepSeek

في هذا الدليل، سنستخدم نموذج DeepSeek-R1-Distill-Llama-32B كمثال. يمكنك اختيار أي قالب بناءً على احتياجاتك، لكن هذا القالب يحدد المعاملات الأساسية للنموذج. ستحتاج إلى تحديد عدد وحدات GPU المطلوبة - نوصي باستخدام RTX 4090 لهذا النشر. تستخدم جميع القوالب نماذج DeepSeek الرسمية بدقة افتراضية BF16. فيما يلي التكوينات الموصى بها:

النموذج GPU الدقة العدد
DeepSeek-R1-Distill-Qwen-1.5B BF16 RTX 4090 1
DeepSeek-R1-Distill-Qwen-7B BF16 RTX 4090 1
DeepSeek-R1-Distill-Llama-8B BF16 RTX 4090 1
DeepSeek-R1-Distill-Qwen-14B BF16 RTX 4090 2
DeepSeek-R1-Distill-Qwen-32B BF16 RTX 4090 4
DeepSeek-R1-Distill-Llama-70B BF16 RTX 4090 8

اختر قالب DeepSeek-R1-Distill-Qwen-32B، واضبط عدد GPUs على 4، ثم انقر على “Deploy”.

لقطة شاشة لموقع novita ai

لقطة شاشة لموقع novita ai

لقطة شاشة لموقع novita ai

الخطوة 4: تخصيص النشر

تأكد من معاملات القالب واملأ متغير HF_TOKEN.

لقطة شاشة لموقع novita ai

يمكنك الحصول على HF_TOKEN باتباع هذه النصائح:

  1. قم بزيارة huggingface.co: https://huggingface.co/

  2. انقر على “Log In” في الزاوية اليمنى العليا لتسجيل الدخول، أو “Sign Up” لإنشاء حساب جديد

  3. بعد تسجيل الدخول، انقر على صورتك الشخصية في الزاوية اليمنى العليا واختر “Access Tokens” من القائمة اليسرى

خطوات الحصول على الرموز من Hugging Face

  1. انقر على “New token” لإنشاء رمز وصول جديد

خطوات الحصول على الرموز من Hugging Face

  1. اختر “Read” لأنواع الرموز، وسمِّ الرمز (مثلاً “text”)، وانقر على “Create token” لتوليد الرمز.

خطوات الحصول على الرموز من Hugging Face

  1. انسخ سلسلة الرمز المولّد

خطوات الحصول على الرموز من Hugging Face

بعد الحصول على الرمز، أدخله في متغير البيئة HF_TOKEN في القالب. ثم انقر على “Next”.

الخطوة 5: تشغيل مثيل

انقر على “Launch Instance” لنشر البيئة التي تم تكوينها.

انتظر بضع دقائق أثناء تكوين المثيل وإدارته.

لقطة شاشة نشر GPU من Novita ai

انقر على القائمة المنسدلة لعرض سجلات المثيل.

نشر GPU من novita ai

بعد بدء المثيل، سيبدأ في سحب النموذج. انقر على “Logs” --> “Instance Logs” لمراقبة تقدم تحميل النموذج.

نشر GPU من novita ai

عندما يظهر في السجل “INFO: Uvicorn running on http://0.0.0.0:8000 (Press CTRL+C to quit)”، فهذا يعني أن البدء تم بنجاح. الآن لندخل إلى نموذجك الخاص!

نشر GPU من novita ai

انقر على “Connect”، ثم انقر على --> “Connect to HTTP Service [Port 8000]”. نظرًا لأن هذه خدمة API، ستحتاج إلى نسخ العنوان.

نشر GPU من novita ai

نشر GPU من novita ai

نشر GPU من novita ai

لإرسال الطلبات إلى نموذجك الخاص، يرجى استبدال https://f6d29cb6f71e585e-8000.us-ca-1.gpu-instance.novita.ai بعنوانك الفعلي المكشوف. انسخ الكود التالي للوصول إلى نموذجك الخاص!

$ curl https://f6d29cb6f71e585e-8000.us-ca-1.gpu-instance.novita.ai/v1/chat/completions  \
   -H "Content-Type: application/json"     -d '{
        "model": "deepseek-ai/DeepSeek-R1-Distill-Qwen-32B",
        "messages": [{"role": "user", "content": "hello"}]
    }'
{"id":"chatcmpl-57b3296f87f54dd4b69cfb6d2196f48e","object":"chat.completion","created":1740711405,"model":"deepseek-ai/DeepSeek-R1-Distill-Qwen-32B","choices":[{"index":0,"message":{"role":"assistant","content":"Alright, the user said \"hello.\" That's a friendly greeting. I should respond in a welcoming manner.\
\
Maybe I can acknowledge their greeting and offer assistance.\
\
It's important to sound approachable and ready to help.\
\
I'll keep it simple and polite.\
 response\
\
Hello! How can I assist you today?","tool_calls":[]},"logprobs":null,"finish_reason":"stop","stop_reason":null}],"usage":{"prompt_tokens":6,"total_tokens":70,"completion_tokens":64,"prompt_tokens_details":null},"prompt_logprobs":null}

نشر GPU من novita ai

قم بتكوين عنوان API في تطبيقاتك مثل Chatbox، وستحصل على مساعدك الشخصي!

[Novita AI](https://novita.ai/?utm_source=blogs_GPU&utm_medium=article&utm_campaign=Deploying DeepSeek Models on Novita AI Cloud Platform: A Comprehensive Guide) هي منصة سحابية للذكاء الاصطناعي تتيح للمطورين نشر نماذج الذكاء الاصطناعي بسهولة باستخدام API بسيط، كما توفر بنية تحتية لوحدات معالجة الرسوميات (GPU) ميسورة التكلفة وموثوقة للبناء والتوسع.