Qwen 3 في مسارات RAG: حل شامل للـ LLM والتضمين وإعادة الترتيب

جدول المحتويات

كيف تعمل نماذج LLM والتضمين وإعادة الترتيب معاً؟
ما هي نماذج Qwen 3 لـ RAG؟
لماذا يتحول المطورون إلى Qwen3 لـ RAG؟
كيفية الوصول إلى نماذج Qwen 3؟

Qwen 3 لـ RAG (llm, embedding, reranking) هو حل ذكاء اصطناعي مفتوح المصدر مصمم للتوليد المعزز بالاسترجاع (Retrieval-Augmented Generation). يجمع بين ثلاثة نماذج رئيسية: نماذج التضمين (embedding) للعثور على المستندات ذات الصلة، ونماذج إعادة الترتيب (reranking) لفرز أفضل النتائج، و LLM قوي لتوليد إجابات واضحة ودقيقة. يدعم Qwen 3 السياق الطويل، واللغات المتعددة، وسهل الاستخدام، مما يجعله مثالياً لبناء أنظمة بحث ذكية وأنظمة أسئلة وأجوبة.

كيف تعمل نماذج LLM والتضمين وإعادة الترتيب معاً؟

1. نماذج التضمين: فهم الاسترجاع (Retrieval)

الغرض:
العثور على المعلومات ذات الصلة من مجموعة كبيرة من المستندات.

كيف تعمل:

يتم تحويل كل مستند (أو جزء من النص) إلى متجه (مصفوفة أرقام) باستخدام نموذج تضمين (مثل OpenAI’s Ada, Sentence Transformers).
يتم أيضاً تضمين استعلام المستخدم في متجه.
يبحث النظام عن متجهات المستندات الأكثر تشابهاً مع متجه الاستعلام (باستخدام مقاييس التشابه مثل تشابه جيب التمام cosine similarity).
يتم استرجاع أفضل N من المستندات الأكثر تشابهاً.

2. نماذج إعادة الترتيب: تحسين الصلة (Improving Relevance)

الغرض:
تحسين نتائج خطوة استرجاع التضمين من خلال ترتيبها بشكل أكثر دقة بناءً على صلتها بالاستعلام.

كيف تعمل:

يتم تقييم المجموعة الأولية من المستندات المسترجعة (على سبيل المثال، أفضل 20) بشكل إضافي باستخدام معيد ترتيب (reranker).
غالباً ما تستخدم معيدات الترتيب نماذج cross-encoder (مثل BERT, RoBERTa) التي تأخذ كلاً من الاستعلام وكل مستند كمدخل وتخرج درجة صلة relevance score.
يتم اختيار المستندات الأعلى ترتيباً للخطوة التالية.

3. LLM (نموذج اللغة الكبير): توليد الإجابات (Generating Answers)

الغرض:
توليد إجابة متماسكة وغنية بالمعلومات بناءً على السياق المسترجع.

كيف يعمل:

يتم دمج المستندات الأعلى ترتيباً أو تلخيصها كـ “سياق” (context).
يتم تزويد LLM بسؤال المستخدم والسياق المسترجع.
يقوم LLM بتوليد رد، مستشهداً بالمعلومات المسترجعة أو مستخدماً لها بشكل مثالي.

كيف يعملون جميعاً معاً (خط أنابيب RAG – RAG Pipeline)

يقدم المستخدم استعلاماً.
نموذج التضمين يسترجع المستندات ذات الصلة.
معيد الترتيب يفرز هذه المستندات حسب الصلة.
LLM يستخدم أفضل المستندات لتوليد إجابة.

ما هي نماذج Qwen 3 لـ RAG؟

نموذج تضمين Qwen 3

النموذج	الحجم	الطبقات	طول التسلسل	بُعد التضمين	دعم MRL	الوعي بالتعليمات
Qwen3 Embedding 0.6B	0.6 مليار	28	32 ألف	1024	نعم	نعم
Qwen3 Embedding 4B	4 مليار	36	32 ألف	2560	نعم	نعم
Qwen3 Embedding 8B	8 مليار	36	32 ألف	4096	نعم	نعم

نموذج إعادة ترتيب Qwen 3


النموذج	الحجم	الطبقات	طول التسلسل	الوعي بالتعليمات
Qwen3-Reranker-0.6B	0.6 مليار	32	32 ألف	نعم
Qwen3-Reranker-4B	4 مليار	36	32 ألف	نعم
Qwen3-Reranker-8B	8 مليار	36	32 ألف	نعم

نموذج LLM Qwen 3

النموذج	البنية	المعلمات (الإجمالي / المُفعّلة)	الطبقات	رؤوس الانتباه (Q / KV)	الخبراء (الإجمالي / النشط)	نافذة السياق (رمز token)
Qwen3-235B-A22B	MoE	235 مليار / 22 مليار	94	64 / 4	128 / 8	32,768 (131,072 مع YaRN)
Qwen3-30B-A3B	MoE	30.5 مليار / 3.3 مليار	48	32 / 4	128 / 8	32,768 (131,072 مع YaRN)
Qwen3-32B	Dense	32.8 مليار	64	64 / 8	-	32,768 (131,072 مع YaRN)
Qwen3-14B	Dense	14.8 مليار	40	40 / 8	-	32,768 (131,072 مع YaRN)
Qwen3-8B	Dense	8.2 مليار	36	32 / 8	-	32,768 (131,072 مع YaRN)
Qwen3-4B	Dense	4.0 مليار	36	32 / 8	-	32,768 (131,072 مع YaRN)
Qwen3-1.7B	Dense	1.7 مليار	28	16 / 8	-	32,768
Qwen3-0.6B	Dense	0.6 مليار	28	16 / 8	-	32,768

لماذا يتحول المطورون إلى Qwen3 لـ RAG؟

الميزة	Qwen 3
نافذة سياق طويلة	32,000 رمز token
أحجام نماذج متعددة	0.6B / 4B / 8B
دعم متعدد اللغات	أكثر من 100 لغة
بنى متقدمة	نماذج إعادة الترتيب تستخدم إعداد cross-encoder / نماذج التضمين تستخدم إعداد bi-encoder
مفتوح المصدر	Apache-2.0
الوعي بالتعليمات	يدعم الوعي بالتعليمات وفهم واتباع تعليمات محددة

أداء نماذج Qwen 3

يمكنك الاطلاع على تقييم نماذج التضمين على لوحة المتصدرين هذه!

كيفية الوصول إلى نماذج Qwen 3؟

Novita AI هي منصة سحابية للذكاء الاصطناعي توفر للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة التطبيقات (API) البسيطة لدينا، مع توفير سحابة GPU موثوقة وبأسعار معقولة للبناء والتوسع.

بالإضافة إلى Qwen 3 Reranker 8B و Embedding 8B، توفر Novita AI أيضاً bge-m3 مجاناً لدعم تطوير مجتمع المصادر المفتوحة!

الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج

سجّل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

جرّب نماذج Qwen 3 الآن!

الخطوة 2: اختر نموذجك وابدأ تجربة مجانية

تصفح الخيارات المتاحة واختر النموذج الذي يناسب احتياجاتك.

الخطوة 3: احصل على مفتاح API الخاص بك

للمصادقة مع واجهة API، سنزودك بمفتاح API جديد. بالدخول إلى صفحة “الإعدادات“، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

الخطوة 4: تثبيت API (مثال: نموذج Qwen 3 Ranker)

قم بتثبيت API باستخدام مدير الحزم الخاص بلغة البرمجة التي تستخدمها.

بعد التثبيت، قم باستيراد المكتبات اللازمة في بيئة التطوير الخاصة بك. قم بتهيئة API باستخدام مفتاح API الخاص بك لبدء التفاعل مع نماذج Novita AI. هذا مثال على استخدام chat completions API لمستخدمي بايثون.

from openai import OpenAI

base_url = "https://api.novita.ai/v3/openai"
api_key = "<Your API Key>"
model = "qwen/qwen3-reranker-8b"

client = OpenAI(
    base_url=base_url,
    api_key=api_key,
)

stream = True # or False
max_tokens = 1000

response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    extra_body={
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

مع تزايد حاجة تطبيقات الذكاء الاصطناعي إلى فهم أكثر دقة لنية المستخدم، أصبحت نماذج إعادة الترتيب أدوات أساسية لتقديم نتائج بحث أكثر ذكاءً. تعمل معيدات الترتيب كطبقة ثانية من الذكاء بعد الاسترجاع الأولي، حيث تقوم بضبط ترتيب المستندات باستخدام تحليل سياقي أعمق. تضع سلسلة Qwen 3 Reranker معياراً جديداً في هذا المجال، حيث تقدم أداءً مذهلاً عبر اللغات والمستندات الطويلة وحتى مهام استرجاع الأكواد البرمجية. ومع التبسيط الذي توفره Novita AI للنشر، يمكن للمطورين تسخير هذه النماذج المتقدمة دون بنية تحتية ثقيلة، مما يجعل الاسترجاع عالي الدقة أكثر سهولة من أي وقت مضى.

الأسئلة الشائعة

ما هو نموذج إعادة الترتيب؟

نموذج إعادة الترتيب يعيد ترتيب قائمة المستندات المسترجعة عن طريق تسجيل صلتها بالاستعلام، مما يحسن الدقة في أنظمة البحث بالذكاء الاصطناعي.

كيف يختلف معيد الترتيب عن نموذج التضمين؟

نموذج التضمين: يحول كل نص إلى متجه ويقارنها باستخدام التشابه.
نموذج إعادة الترتيب: يقرأ كلاً من الاستعلام والمستند معاً ويعطي درجة ذكية للصلة.

كيف أداء Qwen 3 Reranker؟

حقق Qwen3-Reranker-8B أعلى الدرجات:
MTEB-R: 69.02،
CMTEB-R: 77.45،
MTEB-Code: 81.22
يتفوق على النماذج الشائعة مثل BGE و GTE في فئات متعددة.

Novita AI هي المنصة السحابية الشاملة التي تمكّن طموحاتك في الذكاء الاصطناعي. واجهات برمجة تطبيقات متكاملة، بدون خادم (serverless)، مثيلات GPU — الأدوات الفعالة من حيث التكلفة التي تحتاجها. تخلص من البنية التحتية، ابدأ مجاناً، واجعل رؤيتك للذكاء الاصطناعي حقيقة واقعة.