كيفية الوصول إلى Qwen 2 7B باستخدام API أو محليًا: دليل شامل

جدول المحتويات

ما هو Qwen 2 7B؟
كيفية الوصول إلى Qwen 2 7B محليًا
كيفية الوصول إلى Qwen 2 7B عبر Novita AI
دليل خطوة بخطوة
أي الطرق مناسبة لك؟

النقاط الرئيسية

أداء متقدم
تم بناء Qwen 2-7B على بنية قائمة على المحولات مع ميزات متقدمة مثل تنشيط SwiGLU و انحياز QKV للانتباه و انتباه الاستعلام الجماعي (GQA) للاستدلال الأسرع وتقليل استخدام الذاكرة. يدعم طول سياق يصل إلى 131,072 رمزًا، مما يجعله مثاليًا للمهام ذات السياق الطويل.

كيفية الوصول إلى Qwen 2-7B محليًا
يتطلب الوصول المحلي وحدات معالجة رسومية عالية الأداء (مثل NVIDIA RTX 4080 Super) بذاكرة VRAM لا تقل عن 15.4 جيجابايت.

كيفية الوصول إلى Qwen 2-7B عبر API
توفر منصات مثل Novita AI إعدادًا بسيطًا، مما يلغي الحاجة إلى الأجهزة.

توصيات الاستخدام
الوصول المحلي مناسب للباحثين الذين يحتاجون إلى تحكم كامل، بينما الوصول عبر API مثالي للمطورين والشركات التي تسعى إلى نشر سريع وسهولة الاستخدام.

Qwen 2-7B هو نموذج لغة فعال من حيث التكلفة محسّن للأداء، مثالي لتطبيقات مثل فهم اللغة الطبيعية وتوليد الأكواد.

ما هو Qwen 2 7B؟

Qwen 2 - 7B هو نموذج متطور في سلسلة Qwen، مبني على بنية قائمة على المحولات. وهو جزء من سلسلة نماذج لغوية تتراوح من 0.5 إلى 72 مليار معامل، مع Qwen 2-7B-Instruct كمتغير مضبوط ومحسّن للتعليمات.

الميزات الرئيسية

بنية المحولات: تتضمن تنشيط SwiGLU، وانحياز QKV للانتباه، وانتباه الاستعلام الجماعي.
المُرمِّز (Tokenizer): مُرمِّز محسّن قادر على التعامل مع لغات طبيعية متعددة وأكواد برمجية.
التدريب: تم التدريب المسبق على مجموعات بيانات واسعة النطاق وتم تنقيحه من خلال الضبط الدقيق الخاضع للإشراف وتحسين التفضيل المباشر.
طول السياق: يدعم ما يصل إلى 131,072 رمزًا للمهام ذات السياق الطويل.
دعم اللغة: يتفوق في اللغتين الإنجليزية والصينية، مع دعم إضافي للغات أخرى.

https://youtu.be/EG3IFDnYQkA

المعايير

المصدر من LLM EXPLORER

Qwen2.5-7B Instruct:

أفضل أداء إجمالي، يتصدر في MMLU Pro وMUSR وIFEval وMATH Level 5.
يحقق تحسنًا كبيرًا في التفكير الرياضي (MATH Level 5: 50).

Qwen2-7B Instruct:

أفضل أداء في GPQA وBBH.
نموذج متوازن، لكنه متأخر قليلاً عن Qwen2.5-7B في معظم المقاييس الأخرى.

DeepSeek R1 Distill Qwen-7B:

أقل أداء عبر جميع المعايير.
مناسب للمهام خفيفة الوزن لكنه متخلف كثيرًا عن نماذج Qwen2 في المعايير المعقدة.

مقارنة مع نماذج Qwen الأخرى

تتضمن سلسلة Qwen 2 نماذج أساسية ومحسّنة للتعليمات في خمسة أحجام: Qwen2-0.5B وQwen2-1.5B وQwen2-7B وQwen2-57B-A14B وQwen2-72B. فيما يلي ملخص للمعلومات الرئيسية لهذه النماذج:

من Qwen

1. انتباه الاستعلام الجماعي (GQA)

تتبنى جميع النماذج (Qwen2-0.5B وQwen2-7B وQwen2-57B وQwen2-72B) تقنية GQA، مما يوفر:
- سرعة استدلال أسرع.
- تقليل استخدام الذاكرة.
هذا تحسن كبير مقارنة بـ Qwen1.5، حيث كانت النماذج الكبيرة فقط (32B و110B) تستخدم GQA.

2. طول السياق

النماذج الأساسية (Qwen2-0.5B وQwen2-7B وQwen2-57B وQwen2-72B):
- تم التدريب المسبق بطول سياق 32 ألف رمز.
- تُظهر قدرات استقراء قوية تصل إلى 128 ألف رمز بناءً على تقييم الحيرة (PPL).
النماذج المحسّنة للتعليمات (Qwen2-7B-Instruct وQwen2-72B-Instruct):
- تم تقييمها باستخدام مهام مثل “Needle in a Haystack”.
- تؤدي أداءً استثنائيًا في المهام ذات السياق الطويل، مع قدرات تمتد حتى 128 ألف رمز، خاصة عند تعزيزها بـ YARN.

3. القدرات متعددة اللغات

جميع النماذج (Qwen2-0.5B وQwen2-7B وQwen2-57B وQwen2-72B):
- تستفيد من مجموعات بيانات التدريب المسبق المحسّنة التي تتضمن 27 لغة إضافية إلى جانب الإنجليزية والصينية.
- يتحسن الأداء متعدد اللغات مع حجم النموذج، حيث تتفوق النماذج الأكبر (Qwen2-57B وQwen2-72B) في المهام متعددة اللغات الأكثر تعقيدًا.

إذا كنت تريد رؤية مقارنة معاملات أكثر تفصيلاً مع نماذج أخرى مثل Qwen 2.5 72B، يمكنك الاطلاع على هذه المقالة: Qwen 2.5 72b vs Llama 3.3 70b: أي نموذج يناسب احتياجاتك؟ ; Qwen 2.5 vs Llama 3.2 90B: تحليل مقارن لقدرات البرمجة واستدلال الصور.

كيفية الوصول إلى Qwen 2 7B محليًا

توصيات وحدة معالجة الرسوميات (GPU)

النموذج	سعة VRAM	نوع الذاكرة	الأداء النسبي	النطاق السعري
NVIDIA RTX 4080 Super	16 جيجابايت	GDDR6X	عالي	⭐⭐⭐⭐⭐ (فئة عالية)
AMD RX 7900 XTX	24 جيجابايت	GDDR6	عالي	⭐⭐⭐⭐⭐ (فئة عالية)
NVIDIA RTX 4070 Ti Super	16 جيجابايت	GDDR6X	متوسط-عالي	⭐⭐⭐⭐ (فئة وسط-عالية)
AMD RX 7600 XT	16 جيجابايت	GDDR6	متوسط	⭐⭐⭐ (فئة وسط)
NVIDIA RTX 4060 Ti (16GB)	16 جيجابايت	GDDR6	متوسط	⭐⭐⭐ (فئة وسط)

بداية سريعة

from transformers import AutoModelForCausalLM, AutoTokenizer
device = "cuda" # the device to load the model onto

model = AutoModelForCausalLM.from_pretrained(
    "Qwen/Qwen2-7B-Instruct",
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen2-7B-Instruct")

prompt = "Give me a short introduction to large language model."
messages = [
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(device)

generated_ids = model.generate(
    model_inputs.input_ids,
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

كيفية الوصول إلى Qwen 2 7B عبر Novita AI

دليل خطوة بخطوة

Novita AI هي منصة سحابية للذكاء الاصطناعي تقدم للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة التطبيقات البسيطة لدينا، مع توفير سحابة GPU موثوقة وبأسعار معقولة للبناء والتوسع.

الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج

قم بتسجيل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

جرب Qwen 2 7B تجريبي الآن!

الخطوة 2: اختر نموذجك

تصفح الخيارات المتاحة وحدد النموذج الذي يناسب احتياجاتك.

الخطوة 3: ابدأ نسختك التجريبية المجانية

ابدأ نسختك التجريبية المجانية لاستكشاف إمكانيات النموذج المحدد.

الخطوة 4: احصل على مفتاح API الخاص بك

للمصادقة مع API، سنزودك بمفتاح API جديد. بالدخول إلى صفحة “الإعدادات”، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

الخطوة 5: تثبيت API

قم بتثبيت API باستخدام مدير الحزم الخاص بلغة البرمجة المستخدمة.

بعد التثبيت، قم باستيراد المكتبات الضرورية إلى بيئة التطوير الخاصة بك. قم بتهيئة API باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال على استخدام API لإكمال المحادثة لمستخدمي بايثون.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "qwen/qwen-2-7b-instruct"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

عند التسجيل، تقدم Novita AI رصيدًا بقيمة $0.5 لتبدأ!

إذا نفد الرصيد المجاني، يمكنك الدفع لمواصلة الاستخدام.

أي الطرق مناسبة لك؟

مقارنة بين الوصول المحلي وعبر API

الوصول المحلي

الإيجابيات:

يمنح تحكمًا أكبر في النموذج وتكوينه.
مناسب للتعامل مع النصوص الطويلة من خلال الاستفادة من YARN لتعزيز استقراء طول النموذج.
لا توجد تكاليف متكررة.

السلبيات:

يتطلب موارد أجهزة كبيرة، بما في ذلك 15.4 جيجابايت من VRAM.
إعداد وتكوين معقدان.

الوصول عبر API (مثل Novita AI)

الإيجابيات:

سهل الإعداد والاستخدام، مع توفير أدلة خطوة بخطوة.
لا حاجة لموارد أجهزة محلية.

السلبيات:

يتطلب اتصالاً بالإنترنت.
يتضمن تكاليف لكل رمز: 0.054 دولار لكل مليون رمز إدخال و 0.054 دولار لكل مليون رمز إخراج.
تحكم محدود في تخصيص النموذج وتكوينه.

توصيات لمجموعات المستخدمين المختلفة

الباحثون: الوصول المحلي هو المفضل عمومًا للمرونة والتحكم في التجارب.
المطورون:
- الوصول عبر API مناسب لبناء التطبيقات والنماذج الأولية السريعة.
- الوصول المحلي أفضل للضبط الدقيق وسير العمل المخصص.
الشركات: الوصول عبر API مفيد للتكامل السريع في الخدمات دون تكاليف أولية عالية. قد يكون النشر المحلي مناسبًا للفرق ذات المتطلبات الثابتة والقدرة على الاستثمار في البنية التحتية.
الفرق الصغيرة / الأفراد: الوصول عبر API أكثر عملية عمومًا بسبب انخفاض تكاليف البدء.
المستخدمون ذوو المهارات التقنية المحدودة: الوصول عبر API هو الأفضل لأنه يزيل الحاجة إلى معرفة تقنية عميقة.

Qwen 2 - 7B هو نموذج متعدد الاستخدامات وقوي مصمم لمجموعة واسعة من التطبيقات. يدعم كلاً من الوصول المحلي وعبر API، مما يسمح للمستخدمين باختيار الخيار الذي يتوافق بشكل أفضل مع احتياجاتهم الخاصة والموارد المتاحة وخبراتهم التقنية.

الأسئلة الشائعة

ما هي السمات المعمارية الرئيسية لنماذج Qwen2؟

تستخدم نماذج Qwen2 بنية قائمة على المحولات مع ميزات مثل تنشيط SwiGLU وانحياز QKV للانتباه وانتباه الاستعلام الجماعي (GQA).

ما أطوال السياق التي تدعمها نماذج Qwen2؟

يتم التدريب المسبق لنماذج اللغة الأساسية على أطوال سياق تبلغ 32 ألف رمز، وتظهر بعض النماذج قدرات استقراء تصل إلى 128 ألف رمز في تقييم PPL.

Novita AI هي المنصة السحابية الشاملة التي تمكن طموحاتك في الذكاء الاصطناعي. واجهات برمجة تطبيقات متكاملة، بدون خادم، مثيل GPU — الأدوات الفعالة من حيث التكلفة التي تحتاجها. تخلص من البنية التحتية، وابدأ مجانًا، وحقق رؤيتك في الذكاء الاصطناعي.

كيفية الوصول إلى Qwen 2 7B باستخدام API أو محليًا: دليل شامل

النقاط الرئيسية

ما هو Qwen 2 7B؟

الميزات الرئيسية

المعايير

مقارنة مع نماذج Qwen الأخرى

1. انتباه الاستعلام الجماعي (GQA)

2. طول السياق

3. القدرات متعددة اللغات

كيفية الوصول إلى Qwen 2 7B محليًا

توصيات وحدة معالجة الرسوميات (GPU)

بداية سريعة

كيفية الوصول إلى Qwen 2 7B عبر Novita AI

دليل خطوة بخطوة

الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج

الخطوة 2: اختر نموذجك

الخطوة 3: ابدأ نسختك التجريبية المجانية

الخطوة 4: احصل على مفتاح API الخاص بك

الخطوة 5: تثبيت API

أي الطرق مناسبة لك؟

مقارنة بين الوصول المحلي وعبر API

الوصول المحلي

الوصول عبر API (مثل Novita AI)

توصيات لمجموعات المستخدمين المختلفة

الأسئلة الشائعة

قراءة موصى بها

Product

RESOURCES

Partners

Company

النقاط الرئيسية

ما هو Qwen 2 7B؟

الميزات الرئيسية

المعايير

مقارنة مع نماذج Qwen الأخرى

1. انتباه الاستعلام الجماعي (GQA)

2. طول السياق

3. القدرات متعددة اللغات

كيفية الوصول إلى Qwen 2 7B محليًا

توصيات وحدة معالجة الرسوميات (GPU)

بداية سريعة

كيفية الوصول إلى Qwen 2 7B عبر Novita AI

دليل خطوة بخطوة

الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج

الخطوة 2: اختر نموذجك

الخطوة 3: ابدأ نسختك التجريبية المجانية

الخطوة 4: احصل على مفتاح API الخاص بك

الخطوة 5: تثبيت API

أي الطرق مناسبة لك؟

مقارنة بين الوصول المحلي وعبر API

الوصول المحلي

الوصول عبر API (مثل Novita AI)

توصيات لمجموعات المستخدمين المختلفة

الأسئلة الشائعة

قراءة موصى بها

مقالات ذات صلة

Product

RESOURCES

Partners

Company