كيفية الوصول إلى Qwen 3 محليًا أو عبر API: دليل شامل

كيفية الوصول إلى Qwen 3 محليًا أو عبر API: دليل شامل

قم بإحالة أصدقائك إلى Novita AI وستحصل أنت وصديقك على 10 دولارات من رصيد LLM API — حتى 500 دولار إجمالي المكافآت.

لدعم مجتمع المطورين، تتوفر Qwen2.5-7B وQwen 3 0.6B وQwen 3 1.7B وQwen 3 4B مجانًا حاليًا على Novita AI.

qwen 2.5 7b

Qwen 3 هي عائلة نماذج لغة مفتوحة المصدر متعددة الاستخدامات وقوية تم بناؤها بواسطة Alibaba. بفضل هندستها المتطورة وأنماط التفكير المزدوجة، تم تصميمها لخدمة الأجهزة الطرفية واحتياجات المؤسسات واسعة النطاق على حد سواء. تستكشف هذه المقالة قدراتها وأنواع النماذج وكيفية استخدامها — سواء محليًا أو عبر API.

ما هو Qwen 3؟

Qwen 3 هي عائلة نماذج لغة كبيرة مفتوحة المصدر من Alibaba لعام 2025، وتتميز بأنماط “تفكير” و"عدم تفكير" قابلة للتبديل لتعزيز الاستدلال والأداء متعدد اللغات في أكثر من 119 لغة. تتضمن مجموعة نماذج Qwen 3:

مفتوح المصدر ومناسب للاستخدام التجاري

مرخصة بموجب Apache 2.0، وأوزان متاحة بحرية للبحث والاستخدام التجاري. ### نواة محول فعالة (Efficient Transformer Core)

تعمل بنية decoder‑only مع Grouped‑Query‑Attention لتوفير ذاكرة KV للسياقات الطويلة حتى 128 ألف رمز. ### أنماط مزدوجة “تفكير / عدم تفكير”

سلسلة تفكير مفصلة عند الحاجة، وإجابات سريعة مباشرة عندما تكون السرعة مهمة. ### مجموعة ضخمة من 36 تريليون رمز

119 لغة مع بيانات موسعة في STEM والبرمجة لمهارات استدلال وبرمجة أقوى. ### تدريب مسبق على ثلاث مراحل

المهارات الأساسية → إثراء STEM → تكييف السياق الطويل 32 ألف رمز. ### تدريب لاحق على أربع مراحل

Long CoT SFT → تعزيز الاستدلال RL → دمج الأنماط → محاذاة RLHF عامة. ### اتباع التعليمات متعدد اللغات

قوي في الإنجليزية والصينية، وقوي عبر أكثر من 100 لغة للتطبيقات العالمية. ### جاهزية الأدوات / الوكيل

مخطط استدعاء وظائف مدمج لتحديد وتنسيق استدعاءات الأدوات الخارجية. ### نمط إدخال نص / إخراج نص

محسّن لمهام اللغة اليوم؛ متغيرات الرؤية مخطط لها في الإصدارات المستقبلية.

هندسة سلسلة Qwen 3

qwen 3

معايير سلسلة Qwen 3

Qwen 3 Series Benchmark

Qwen 3 Series Benchmark

النماذج عالية المعلمات مثل Qwen-23B وQwen-14B تتبع القواعد باستمرار، مع تسجيل النماذج الأكبر والإصدارات الممكّنة بالتفكير درجات أعلى. قد تنبع هذه التناقضات في النماذج منخفضة المعلمات من قيود في قدراتها على التفكير، حيث تفتقر إلى القدرة على الاستفادة الكاملة من آليات التفكير، مما يؤدي إلى أداء دون المستوى الأمثل.

كيفية الوصول إلى Qwen 3 محليًا؟

متطلبات الأجهزة

النموذج GPU الموصى به VRAM vCPUs RAM التخزين
Qwen3-0.6B RTX 3060 / T4 8 GB 4 8 GB 20 GB
Qwen3-1.7B RTX 3060 / A5000 12–24 GB 6–8 16 GB 30 GB
Qwen3-4B A100 40GB / RTX 3090 24–40 GB 12+ 24 GB 40 GB
Qwen3-8B A100 80GB / H100 40–80 GB 16+ 48 GB 60 GB
Qwen3-14B 2× A100 80GB / 1× H100 80 GB+ 24+ 64 GB 80 GB
Qwen3-30B (MoE) 2× H100 / 4× A100 160 GB 48+ 128 GB 160 GB
Qwen3-32B 2× H100 / 4× A100 160 GB 64 160 GB 200 GB
Qwen3-235B (MoE) 8× H100 / 8× A100 640 GB 128+ 512 GB 500+ GB

دليل التثبيت خطوة بخطوة

# الخطوة 1: تثبيت Python وإنشاء بيئة افتراضية
# تأكد من تثبيت Python (>=3.8). ثم أنشئ بيئة افتراضية وقم بتنشيطها.
python3 -m venv llama_env
source llama_env/bin/activate  # في Windows، استخدم `llama_env\Scripts\activate`

# الخطوة 2: تثبيت المكتبات المطلوبة
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118  # لتحسين GPU
pip install bitsandbytes  # استغلال فعال لذاكرة GPU

# الخطوة 3: تثبيت واجهة سطر الأوامر Hugging Face وتسجيل الدخول
pip install huggingface-cli
huggingface-cli login  # اتبع التعليمات للمصادقة

# الخطوة 4: طلب الوصول إلى Llama-3.3 70B
# قم بزيارة صفحة نموذج Hugging Face لـ Llama-3.3 70B وطلب الوصول.
# الرابط: https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct

# الخطوة 5: تنزيل ملفات النموذج
huggingface-cli download meta-llama/Llama-3.3-70B-Instruct --include "original/*" --local-dir Llama-3.3-70B-Instruct

# الخطوة 6: تحميل النموذج محليًا
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

# معرف النموذج ومسار الدليل المحلي
model_id = "meta-llama/Llama-3.3-70B-Instruct"
local_model_dir = "./Llama-3.3-70B-Instruct"

# تحميل النموذج مع تحسين GPU
model = AutoModelForCausalLM.from_pretrained(
    local_model_dir,
    device_map="auto",          # تعيين طبقات النموذج تلقائيًا إلى GPU(s)
    torch_dtype=torch.bfloat16  # استخدام bfloat16 لاستخدام ذاكرة فعال
)

# تحميل tokenizer
tokenizer = AutoTokenizer.from_pretrained(local_model_dir)

# الخطوة 7: تشغيل الاستدلال
# تعريف النص المدخل
input_text = "اشرح نظرية النسبية بعبارات بسيطة."

# تحويل الإدخال إلى رموز
inputs = tokenizer(input_text, return_tensors="pt").to("cuda")  # إرسال الإدخالات إلى GPU

# توليد استجابة
with torch.no_grad():
    outputs = model.generate(
        **inputs,
        max_length=100,  # تعيين الحد الأقصى لطول الاستجابة
        temperature=0.7,  # ضبط الإبداع (القيمة الأقل = إبداع أقل، الأعلى = إبداع أكثر)
        top_k=50,         # أخذ العينات top-k للتنوع
    )

# فك تشفير رموز الإخراج
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print("الاستجابة:", response)

كيفية الوصول إلى Qwen 3 عبر API

Novita AI تقدم منصة استدلال ميسورة التكلفة وموثوقة وبسيطة مع Llama 3.3 70b API قابلة للتوسع، لتمكين المطورين من بناء تطبيقات الذكاء الاصطناعي. جرب عرض Novita AI Llama 3.3 70b API اليوم!

الخيار 1: التكامل المباشر مع API (مثال بلغة Python)

qwen 3 api

جرب Qwen3 بسعر منخفض جدًا الآن!

الميزات الرئيسية:

  • نقطة نهاية موحدة:/v3/openai تدعم تنسيق OpenAI Chat Completions API.
  • تحكمات مرنة: ضبط درجة الحرارة، top-p، العقوبات، والمزيد للحصول على نتائج مخصصة.
  • البث والتجميع: اختر وضع الاستجابة المفضل لديك.

الخيار 2: سير عمل متعدد الوكلاء مع OpenAI Agents SDK

قم ببناء أنظمة متقدمة متعددة الوكلاء من خلال دمج Novita AI مع OpenAI Agents SDK:

  • تشغيل فوري: استخدم نماذج LLM من Novita AI في أي سير عمل لـ OpenAI Agents.
  • يدعم التحويل والتوجيه واستخدام الأدوات: صمم وكلاء يمكنهم التفويض أو الفرز أو تشغيل الوظائف، جميعها مدعومة بنماذج Novita AI.
  • تكامل Python: ما عليك سوى توجيه SDK إلى نقطة نهاية Novita (https://api.novita.ai/v3/openai) واستخدام مفتاح API الخاص بك.

ربط Qwen 3 API على منصات الطرف الثالث

  • Hugging Face: استخدم Qwen 3 في Spaces أو pipelines أو مع مكتبة Transformers عبر نقاط نهاية Novita AI.

Qwen 3 API على منصات الطرف الثالث

  • أطر الوكيل والتنسيق: قم بتوصيل Novita AI بسهولة مع منصات شريكة مثل Continue وAnythingLLM وLangChain وDify وLangflow من خلال موصلات رسمية وأدلة تكامل خطوة بخطوة.
  • API متوافق مع OpenAI: استمتع بالترحيل والتكامل بدون متاعب مع أدوات مثل Cline وCursor، المصممة وفقًا لمعيار OpenAI API.

ما هي الطرق المناسبة لك؟

مقارنة بين الوصول المحلي وعبر API

الجانب الوصول المحلي الوصول عبر API
قابلية التوسع محدودة؛ تتطلب ترقيات يدوية. يتوسع تلقائيًا وبكفاءة.
المرونة مرونة عالية؛ تحكم كامل في الإعدادات. أقل مرونة؛ يعتمد على تكوينات المزود.
سهولة الاستخدام يتطلب خبرة تقنية. أسهل في الاستخدام، لا حاجة لإعداد معقد.
التكلفة تكلفة أولية عالية، تكاليف جارية منخفضة. الأفضل للاستخدام طويل الأمد. الدفع حسب الاستخدام، مثالي للاستخدام الصغير أو العرضي.

توصيات لمجموعات المستخدمين المختلفة

  • الباحثون → يفضلون الوصول المحلي للتحكم الكامل ومرونة التجارب.
  • المطورون → استخدم API للاختبار السريع وبناء التطبيقات؛ استخدم المحلي للتدريب المخصص.
  • الشركاتAPI رائع للتكامل السهل؛ المحلي مناسب للفرق ذات الاحتياجات المستقرة.
  • الفرق الصغيرة والأفرادAPI أكثر ملاءمة للميزانية وأسهل للبدء.
  • المستخدمون غير التقنيين → بالتأكيد اختر API — لا حاجة لإعداد معقد.

سواء كنت باحثًا أو مطورًا أو فريق عمل، فإن Qwen 3 يتكيف مع احتياجاتك. يوفر الوصول المحلي التحكم والتخصيص، بينما توفر APIs قابلية التوسع الفوري وحاجز دخول منخفض. يضمن تصميم Qwen 3 قدرات قوية متعددة اللغات وفي الاستدلال والمدعومة بالأدوات للمهام الواقعية.

الأسئلة الشائعة

ما الذي يميز Qwen 3 عن نماذج LLM الأخرى؟

يدعم أنماط تفكير مزدوجة، وتعليمات متعددة اللغات قوية، وسياق طويل (128 ألف رمز)، مع أوزان مفتوحة وترخيص مناسب تجاريًا.

هل يمكنني تشغيل Qwen 3 على جهاز الكمبيوتر الخاص بي؟

فقط النماذج الأصغر (مثل 0.6B) مناسبة لوحدات GPU الاستهلاكية. النماذج الأكبر تتطلب إعدادات A100/H100.

هل الوصول عبر API أسهل؟

نعم! Novita AI و Hugging Face تقدم Qwen 3 APIs منخفضة التكلفة وجاهزة للتشغيل — مثالية للتكامل السريع والاستخدام منخفض زمن الانتظار.

Novita AI هي منصة سحابية شاملة تمكّن طموحاتك في الذكاء الاصطناعي. واجهات برمجة تطبيقات متكاملة، خوادم بدون خادم، مثيلات GPU — الأدوات الفعالة من حيث التكلفة التي تحتاجها. تخلص من البنية التحتية، ابدأ مجانًا، وحقق رؤيتك في الذكاء الاصطناعي.

قراءات موصى بها