دليل الوصول إلى DeepSeek V3: محليًا وعبر API

دليل الوصول إلى DeepSeek V3: محليًا وعبر API

النقاط الرئيسية

يقدم DeepSeek V3 ميزات معمارية مبتكرة مثل MoE وMLA، مما يعزز الكفاءة وطول السياق بشكل كبير.

تتميز فعالية تكلفة DeepSeek V3 بكونها رائعة، مع تكاليف تدريب منخفضة ورسوم استخدام API أرخص من المنافسين.

يمكن للمستخدمين الوصول إلى DeepSeek V3 عبر Novita AI API أو نشره محليًا، مما يوفر مرونة لمختلف الاحتياجات والموارد.

صعد نموذج DeepSeek، النموذج المبتكر للذكاء الاصطناعي، إلى الشهرة العالمية في أواخر يناير 2025. بعد إصدار نموذج V3 وتطبيقه، أثار فتح نموذج الاستدلال R1 في 20 يناير اهتمامًا عالميًا. في غضون أيام، صعد تطبيق DeepSeek إلى قمة متجر التطبيقات الأمريكي، متجاوزًا عمالقة التكنولوجيا. لذا، في هذه المقالة، سننظر في كيفية الوصول إليه، ومقارنة النشر المحلي مع الوصول عبر API، وتقديم إرشادات لاحتياجات المستخدمين المختلفة.

ما هو DeepSeek-v3

DeepSeek V3 هو نموذج لغة كبير مفتوح المصدر من نوع Mixture-of-Experts (MoE) تم تطويره بواسطة شركة Beijing DeepSeek Technology Co., Ltd. يمتلك هذا النموذج المتقدم 671 مليار معلمة، مع تفعيل 37 مليارًا فقط لكل رمز أثناء الاستدلال، مما يحسن الأداء مع تقليل استهلاك الموارد. تم تصميم DeepSeek V3 لمنافسة النماذج الرائدة مثل GPT، خاصة في التفوق في مهام البرمجة والتقنية.

الميزات الرئيسية

ما هو moe

  • معمارية Mixture-of-Experts (MoE): يستخدم DeepSeek V3 إطار عمل MoE مع تقنيات موازنة تحميل ديناميكية دقيقة، مما يلغي الحاجة إلى فقدان مساعد.
  • الانتباه الكامن متعدد الرؤوس (MLA): تعزز هذه الميزة كفاءة الاستدلال عن طريق ضغط مفاتيح وقيم الانتباه، مما يقلل من عبء الذاكرة ويمكّن النموذج من التعامل مع نوافذ سياق طويلة تصل إلى 128 ألف رمز.
  • التنبؤ متعدد الرموز (MTP): يسمح MTP لـ DeepSeek V3 بالتنبؤ برموز متعددة في وقت واحد، مما يحسن كفاءة التدريب وسرعة الاستدلال.
  • تدريب الدقة المختلطة FP8: يستخدم النموذج دقة نقطة عائمة 8 بت للتدريب، مما يقلل من تكاليف الذاكرة والحساب.
  • الدعم ثنائي اللغة: تم تحسين DeepSeek V3 لكل من الإنجليزية والصينية، مما يجعله مناسبًا للتطبيقات متعددة اللغات في هاتين اللغتين.

كما هو موضح في الرسم البياني، يحقق DeepSeek-V3 توازنًا مثاليًا بين الأداء العالي والتكلفة المنخفضة من خلال تصميمه المعماري المبتكر، مما يجعله معيارًا لنسبة الأداء إلى السعر. يسمح هذا التصميم لـ DeepSeek-V3 بالتميز بين العديد من النماذج، مما يجعله خيارًا متعدد الاستخدامات لمختلف الميزانيات ومتطلبات المهام.

  • مهام الاستدلال واسعة النطاق (مثل إنشاء المحتوى بكميات كبيرة).
  • المؤسسات والفرق الصغيرة والمتوسطة التي تركز بشدة على كفاءة التكلفة.
  • المهام التي تتضمن الرياضيات، وتوليد التعليمات البرمجية، والاستدلال المنطقي المعقد.

DeepSeek-V3 متاح الآن على Novita AI! استمتع بأسعار منخفضة بشكل لا يصدق لكل مليون رمز لكل من الإدخال والإخراج — لا تفوت هذه الفرصة للوصول إلى الذكاء الاصطناعي المتطور بتكلفة لا تُقهر!

مقارنة مع النماذج الأخرى

DeepSeek-V3 هو نموذج قوي يتفوق في مجالات متعددة، خاصة في التعامل مع المعرفة المهنية والرياضيات الأساسية ومهام البرمجة. ومع ذلك، لديه مجال للتحسين في الاستدلال المتقدم وتطبيقات المجالات المحددة. يشير هذا إلى مجالات للتحسينات المستقبلية، مثل تعزيز حل المشكلات المفتوحة، والاستدلال الرياضي المعقد، والأداء في سيناريوهات هندسة البرمجيات العملية.

إذا كنت ترغب في رؤية مقارنة أكثر تفصيلاً للمعلمات، يمكنك الاطلاع على المقالات: Deepseek v3 vs Llama 3.3 70b: Language Tasks vs Code & Math؛ Llama 3.2 3B vs DeepSeek V3: Comparing Efficiency and Performance.

كيفية الوصول إلى DeepSeek-v3 محليًا

متطلبات الأجهزة وتوصيات التكوين

  • نظام التشغيل

    • Windows 10 أو أحدث
    • macOS 10.15 أو أحدث
    • Linux (Ubuntu 18.04+)
  • وحدة المعالجة المركزية (CPU)

    • معالج متعدد النوى (4 أنوية على الأقل)
  • وحدة معالجة الرسومات (GPU)

    • يوصى باستخدام وحدات معالجة رسومات NVIDIA للاستدلال الأسرع
    • ذاكرة VRAM بسعة 8 جيجابايت على الأقل للنسخ الأصغر من R1 distill
    • مطلوب ذاكرة VRAM أكبر للنموذج الكامل 671B
    • يمكن التشغيل باستخدام وحدة المعالجة المركزية فقط ولكن سيكون أبطأ بشكل كبير
  • الذاكرة (RAM)

    • 8 جيجابايت: كافية لأصغر الإصدارات (1.5B أو 7B)
    • 16 جيجابايت أو أكثر: موصى به للنماذج المتوسطة (14B أو 32B)
  • التخزين

    • مساحة خالية من 4–50 جيجابايت مطلوبة، حسب حجم R1 الذي تم تنزيله
  • متطلبات البرامج

    • Python 3.10 للنصوص الرسمية لـ R1

دليل التثبيت خطوة بخطوة

1. استنساخ المستودع:

git clone https://github.com/deepseek-ai/DeepSeek-V3.git

2. الانتقال إلى مجلد الاستدلال وتثبيت التبعيات:

cd DeepSeek-V3/inference
pip install -r requirements.txt

3. تنزيل أوزان النموذج:
قم بتنزيل أوزان النموذج من Hugging Face ووضعها في الدليل المحدد (مثل /path/to/DeepSeek-V3).

4. تحويل أوزان النموذج:
استخدم البرنامج النصي convert.py المقدم لتحويل الأوزان إلى تنسيق معين. على سبيل المثال:

python convert.py --hf-ckpt-path /path/to/DeepSeek-V3 --save-path /path/to/DeepSeek-V3-Demo --n-experts 256 --model-parallel 16

5. تشغيل DeepSeek-V3:
استخدم الأمر torchrun لبدء النموذج. قم بتعديل المعلمات حسب الحاجة لإعدادك. مثال:

torchrun --nnodes 2 --nproc-per-node 8 --node-rank $RANK --master-addr $ADDR generate.py --ckpt-path /path/to/DeepSeek-V3-Demo --config configs/config_671B.json --interactive --temperature 0.7 --max-new-tokens 200

6. الاستدلال الدفعي (اختياري):
للاستدلال الدفعي على ملف معين:

torchrun --nnodes 2 --nproc-per-node 8 --node-rank $RANK --master-addr $ADDR generate.py --ckpt-path /path/to/DeepSeek-V3-Demo --config configs/config_671B.json --input-file $FILE

كيفية الوصول إلى DeepSeek-v3 عبر Novita AI

Novita AI هي منصة سحابية للذكاء الاصطناعي تقدم للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام API بسيط، مع توفير سحابة GPU ميسورة التكلفة وموثوقة للبناء والتوسع.

الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج

سجل الدخول إلى حسابك وانقر على زر Model Library.

تسجيل الدخول والوصول إلى مكتبة النماذج

جرب عرض DeepSeek V3 الآن!

الخطوة 2: اختر نموذجك

تصفح الخيارات المتاحة واختر النموذج الذي يناسب احتياجاتك.

اختيار النماذج

الخطوة 3: ابدأ تجربتك المجانية

ابدأ تجربتك المجانية لاستكشاف قدرات النموذج المحدد.

التجربة المجانية

الخطوة 4: احصل على مفتاح API الخاص بك

لمصادقة API، سنقدم لك مفتاح API جديد. أدخل صفحة “Settings“، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

احصل على مفتاح API

الخطوة 5: تثبيت API

قم بتثبيت API باستخدام مدير الحزم الخاص بلغة البرمجة الخاصة بك.

تثبيت API

بعد التثبيت، قم باستيراد المكتبات الضرورية إلى بيئة التطوير الخاصة بك. قم بتهيئة API باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال على استخدام chat completions API لمستخدمي Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "deepseek/deepseek_v3"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=&#91;
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices&#91;0].delta.content or "", end="")
else:
    print(chat_completion_res.choices&#91;0].message.content)
  
  

عند التسجيل، توفر Novita AI رصيدًا بقيمة $0.5 لتبدأ!

إذا نفد الرصيد المجاني، يمكنك الدفع لمواصلة الاستخدام.

ما هي الطرق المناسبة لك؟

مقارنة الوصول المحلي مقابل API

الميزة النشر المحلي الوصول عبر API
التحكم عالٍ محدود
التخصيص مرن مقيد
متطلبات الأجهزة عالية منخفضة
التكلفة الأولية عالية منخفضة
قابلية التوسع محدودة عالية
صعوبة الصيانة عالية منخفضة
حماية الخصوصية قوية تعتمد على المزود

توصيات لمجموعات المستخدمين المختلفة

  • للباحثين والمطورين

    • توصية: النشر المحلي لـ DeepSeek V3.
    • لماذا: يوفر تحكمًا كاملاً في النموذج، مما يسمح بتخصيص وتحسين واسع النطاق.
    • اعتبارات: يتطلب موارد أجهزة كبيرة وخبرة تقنية متقدمة.
  • للشركات الناشئة والشركات الصغيرة والمتوسطة

    • توصية: استخدام DeepSeek V3 API المقدم من Novita AI.
    • المزايا: فعال من حيث التكلفة، وسهل التكامل، وقابل للتوسع لتلبية احتياجات الأعمال المتطورة.
    • أفضل حالات الاستخدام: نمذجة الأفكار بسرعة وبناء تطبيقات تعمل بالذكاء الاصطناعي دون استثمارات مسبقة كبيرة.

في الختام، DeepSeek V3 هو نموذج مفتوح المصدر قوي يقدم أداءً متميزًا في مهام البرمجة والرياضيات والاستدلال. يوفر مرونة لحالات الاستخدام المتنوعة، سواء تم نشره محليًا أو الوصول إليه عبر APIs. بينما يوفر النشر المحلي تحكمًا كاملاً، إلا أنه يتطلب موارد أجهزة كبيرة. بدلاً من ذلك، توفر منصات مثل Novita AI طريقة أكثر سهولة وملاءمة لاستخدام قدرات النموذج. يعتمد الخيار الأمثل على متطلبات مشروعك وخبرتك الفنية وميزانيتك.

الأسئلة المتكررة

كيف يحقق DeepSeek V3 كفاءته؟

يستخدم DeepSeek V3 معمارية Mixture-of-Experts (MoE)، حيث يقوم بتفعيل 37 مليار معلمة فقط لكل رمز. يستخدم Multi-Head Latent Attention (MLA) وهدف Multi-Token Prediction (MTP) لتقليل استهلاك الموارد وتسريع كل من التدريب والاستدلال.

ما هي المزايا الرئيسية لـ DeepSeek V3؟

يتفوق DeepSeek V3 في مهام البرمجة والرياضيات والاستدلال والمعرفة العامة، ويدعم دعمًا قويًا متعدد اللغات للإنجليزية والصينية. يظهر أداءً استثنائيًا عبر معايير مختلفة، وغالبًا ما يتفوق على النماذج مفتوحة المصدر وحتى المغلقة الأخرى.

ما هي متطلبات VRAM لـ DeepSeek V3؟

تختلف متطلبات VRAM لـ DeepSeek V3 بناءً على الدقة. بالنسبة لـ FP16، يتطلب نموذج 671B ما يقرب من 1,543 جيجابايت من VRAM، بينما مع كمية 4 بت، يتطلب ما يقرب من 386 جيجابايت من VRAM. المعلمات النشطة هي 37B.

Novita AI هي منصة سحابية شاملة تمكّن طموحاتك في الذكاء الاصطناعي. واجهات برمجة تطبيقات متكاملة، بدون خادم، مثيل GPU — الأدوات الفعالة من حيث التكلفة التي تحتاجها. تخلص من البنية التحتية، ابدأ مجانًا، وحقق رؤيتك في الذكاء الاصطناعي.

قراءة موصى بها