bge-reranker-v2-m3 متاح الآن على Novita AI

bge-reranker-v2-m3 متاح الآن على Novita AI

النقاط الرئيسية

نماذج إعادة الترتيب (Reranking Models): تُعد نماذج إعادة الترتيب أساسية لتحسين جودة نتائج البحث من خلال إعادة ترتيب المستندات المرشحة بذكاء بناءً على تقييم دقيق للصلة، مما يضمن للمستخدمين رؤية المعلومات الأكثر صلة أولاً.

BAAI/bge-reranker-v2-m3: يقدم نموذج bge-reranker-v2-m3 قدرات استثنائية لإعادة الترتيب عبر اللغات، ويدعم أكثر من 18 لغة، ويتميز في معالجة أزواج الاستعلام والمستندات لتقييم الصلة بدقة. ودقته ودعمه متعدد اللغات يجعله لا غنى عنه لتجارب بحث عالية الجودة.

نموذج bge-reranker-v2-m3 القوي متاح الآن على Novita AI، مما يوفر حلول إعادة ترتيب فعالة من حيث التكلفة. ابدأ نسختك التجريبية المجانية على Novita AI!

إعادة الترتيب هي حجر الزاوية في أنظمة البحث الحديثة، حيث تمكّن التطبيقات من تقديم نتائج عالية الصلة من خلال تحليل دقيق للصلة. يشرح هذا الدليل ماهية أدوات إعادة الترتيب (نماذج إعادة الترتيب)، وأهميتها لجودة البحث، وكيف يؤدي نموذج BAAI/bge-reranker-v2-m3 إلى رفع قدرات البحث لتحقيق تجارب مستخدم فائقة.

فهم أدوات إعادة الترتيب (Rerankers)

أداة إعادة الترتيب هي نموذج ذكاء اصطناعي متخصص مصمم لتحسين نتائج البحث وإعادة ترتيبها من خلال تقييم الصلة الدلالية بين الاستعلامات والمستندات المرشحة. على عكس أنظمة الاسترجاع التقليدية التي تركز على السرعة والاسترجاع الشامل، تُعطي أدوات إعادة الترتيب الأولوية للدقة عن طريق حساب درجات صلة مفصلة لأزواج الاستعلام والمستندات.

في تطبيقات الذكاء الاصطناعي الحديثة، تلعب أدوات إعادة الترتيب دورًا حاسمًا بشكل خاص في أنظمة RAG (التوليد المعزز بالاسترجاع)، حيث تؤثر جودة المستندات المسترجعة بشكل مباشر على الاستجابة النهائية المُولَّدة. تعمل مرحلة إعادة الترتيب كمرشح دقة، لضمان وصول المستندات الأكثر صلة فقط إلى مرحلة توليد المحتوى.

خط أنابيب RAG مع إعادة الترتيب

تستخدم أنظمة استرجاع المعلومات الحديثة عادةً بنية من مرحلتين كما هو موضح أعلاه. تستخدم المرحلة الأولى طرق استرجاع سريعة أولية مثل نماذج البرج المزدوج، أو BM25، أو قواعد البيانات المتجهة لتصفية المستندات المرشحة بسرعة من المجموعات الكبيرة. تستخدم المرحلة الثانية أدوات إعادة الترتيب لإجراء فرز دقيق لهذه النتائج المرشحة، مع التركيز على الحكم الدقيق على الصلة.

تستخدم أدوات إعادة الترتيب بنية الترميز المتقاطع (cross-encoder) التي تعالج الاستعلام والمستند معًا، مما يتيح تفاعلًا أعمق مقارنة بطرق الاسترجاع التقليدية. تسمح هذه البنية لأدوات إعادة الترتيب بتحديد الارتباطات الدلالية المعقدة، والمرادفات، والعلاقات الهرمية التي قد يفوتها المطابقة القائمة على الكلمات المفتاحية.

تطبيقات أدوات إعادة الترتيب

تتفوق أدوات إعادة الترتيب في سيناريوهات تطبيقية متنوعة حيث يكون الفهم الدلالي والترتيب الدقيق أمرًا بالغ الأهمية:

تطبيقات المجالات الحيوية

  • أنظمة المعلومات الطبية: استرجاع الأدبيات الطبية ذات الصلة حيث الدقة أمر حيوي
  • استرجاع المستندات القانونية: إيجاد السوابق القضائية والقوانين الدقيقة للمهنيين القانونيين
  • البحث العلمي: إظهار الدراسات الأكثر صلة من آلاف الأوراق البحثية

الأنظمة المدعومة بالذكاء الاصطناعي

  • أنظمة الأسئلة والأجوبة: في أنظمة RAG، تضمن أدوات إعادة الترتيب اختيار المستندات الأكثر صلة دلاليًا كسياق لتوليد الإجابة، مما يؤثر بشكل مباشر على جودة ودقة الاستجابة
  • أنظمة التوصية: فرز العناصر المرشحة حسب الصلة بتفضيلات المستخدم، مما يحسن التفاعل والتخصيص

حلول المؤسسات

  • بحث المؤسسات: تستخدم المؤسسات الكبيرة أدوات إعادة الترتيب لتحسين استرجاع المستندات عبر قواعد المعرفة الضخمة، مما يجعل اكتشاف المعلومات أكثر كفاءة ودقة
  • محركات البحث: إجراء ترتيب ثانوي لنتائج البحث لتحسين الصلة ورضا المستخدم بما يتجاوز مطابقة الكلمات المفتاحية التقليدية

تطبيقات عبر المنصات

  • المنصات متعددة اللغات: التعامل الفعال مع سيناريوهات الاسترجاع عبر اللغات، مما يوفر جودة بحث متسقة عبر اللغات المختلفة

فهم نموذج BAAI/bge-reranker-v2-m3

BAAI/bge-reranker-v2-m3 هو نموذج إعادة ترتيب خفيف متعدد اللغات طورته أكاديمية بكين للذكاء الاصطناعي (BAAI). كجزء من سلسلة BGE (التضمين العام لبكين)، تم تحسين هذا النموذج خصيصًا لمهام إعادة الترتيب عبر العديد من اللغات.

الميزات الرئيسية:

  • تصميم خفيف: 568 مليون معلمة للنشر الفعال
  • دعم متعدد اللغات: أكثر من 18 لغة مع قدرات عبر اللغات
  • استدلال سريع: أوقات استجابة على مستوى الميلي ثانية
  • تكامل سهل: واجهات برمجة تطبيقات ومكتبات متعددة متاحة

المواصفات الفنية:

  • البنية: تصنيف تسلسل الترميز المتقاطع (Cross-encoder sequence classification)
  • تنسيق الإدخال: [نص الاستعلام، نص المستند]
  • الحد الأقصى للطول: 512 رمزًا (token)
  • المخرجات: درجات صلة مباشرة مع تطبيع اختياري
  • التسريع: دعم fp16/bf16 لاستدلال GPU

اللغات المدعومة: الإنجليزية، الصينية، اليابانية، الكورية، الإسبانية، الفرنسية، الألمانية، الروسية، العربية، الهندية، البنغالية، الفارسية، الفنلندية، الإندونيسية، التايلاندية، التيلجو، السواحيلية، اليوروبا

تم تدريب النموذج على مجموعات بيانات متنوعة تشمل bge-m3-data (استرجاع متعدد اللغات)، وبيانات تدريب Quora (أزواج الأسئلة والأجوبة)، وبيانات تدريب FEVER (التحقق من الحقائق)، مما يضمن أداءً قويًا عبر مختلف المجالات وحالات الاستخدام.

llama-index.

llama-index.

BEIR.

BEIR. إعادة ترتيب أفضل 100 نتيجة من bge-en-v1.5 large.

إعادة ترتيب أفضل 100 نتيجة من bge-en-v1.5 large.

BEIR. إعادة ترتيب أفضل 100 نتيجة من e5 mistral 7b instruct.

إعادة ترتيب أفضل 100 نتيجة من e5 mistral 7b instruct.

CMTEB-retrieval.

CMTEB-retrieval.

إعادة ترتيب أفضل 100 نتيجة من bge-zh-v1.5 large.

miracl (متعدد اللغات).

miracl (متعدد اللغات).

إعادة ترتيب أفضل 100 نتيجة من bge-m3.

كيفية الوصول إلى BAAI/bge-reranker-v2-m3 على Novita AI

Novita AI هي منصة سحابية للذكاء الاصطناعي تقدم للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة التطبيقات البسيطة الخاصة بنا، مع توفير سحابة GPU ميسورة التكلفة وموثوقة للبناء والتوسع.

الخطوة 1: تسجيل الدخول والوصول إلى لوحة تحكم النماذج

قم بتسجيل الدخول إلى حسابك وادخل إلى لوحة تحكم النماذج.

لوحة تحكم نماذج Novita

الخطوة 2: اختر نموذجك وابدأ نسخة تجريبية مجانية

تصفح الخيارات المتاحة وابحث عن النموذج الذي يناسب احتياجاتك.

اختر نموذجك

جرّب bge-reranker-v2-m3 مجانًا!

الخطوة 3: احصل على مفتاح API الخاص بك

للمصادقة مع واجهة برمجة التطبيقات، سنقدم لك مفتاح API جديدًا. ادخل إلى صفحة “الإعدادات”، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

احصل على مفتاح API الخاص بك

الخطوة 4: تثبيت واجهة برمجة التطبيقات

قم بتثبيت واجهة برمجة التطبيقات باستخدام مدير الحزم الخاص بلغة البرمجة التي تستخدمها.

تثبيت واجهة برمجة التطبيقات

بعد التثبيت، قم باستيراد المكتبات اللازمة إلى بيئة التطوير الخاصة بك. قم بتهيئة واجهة برمجة التطبيقات باستخدام مفتاح API الخاص بك لبدء التفاعل مع خدمة إعادة الترتيب من Novita AI. يوضح هذا المثال كيفية استخدام واجهة برمجة تطبيقات إعادة الترتيب.

curl --request POST \
  --url "https://api.novita.ai/v3/openai/rerank" \
  --header "Authorization: Bearer <Your API Key>" \
  --header "Content-Type: application/json" \
  --data @- << 'EOF'
{
  "model": "baai/bge-reranker-v2-m3",
  "query": "Who is Novita",
  "documents": [
    "Novita AI is an all-in-one AI cloud solution that empowers businesses with open-source model APIs, serverless GPUs, and on-demand GPU instances. Drive innovation and gain a competitive edge with the power of Novita AI.",
    "Access Novita AI's Model Library with 200+ APIs for language, image, audio, and video. Simplify AI deployment with powerful, scalable solutions.",
    "Optimize your AI with Novita's GPU instances and serverless GPU cloud. Save up to 50%, auto-scale, and access high-capacity storage for global deployment."
  ],
  "top_n": 3
}
EOF
 

عند التسجيل، تقدم Novita AI رصيدًا بقيمة $0.5 لتبدأ!

إذا نفد الرصيد المجاني، يمكنك الدفع لمواصلة الاستخدام.

تلعب أدوات إعادة الترتيب دورًا حاسمًا في استرجاع المعلومات وتطبيقات الذكاء الاصطناعي، مما يسمح للأنظمة بفهم الصلة الدلالية بشكل فعال وتحسين دقة البحث. نماذج متقدمة مثل BAAI/bge-reranker-v2-m3 ترفع هذه القدرات من خلال أداء فائق ودعم لغوي واسع، مما يجعلها أدوات لا غنى عنها لدفع تطبيقات الذكاء الاصطناعي الحديثة.

الأسئلة المتكررة

ما الفرق بين BGE Reranker Large و BGE Reranker v2 m3؟

BGE Reranker Large مبني على xlm-roberta-large ويدعم اللغتين الصينية والإنجليزية، بينما BGE Reranker v2 m3 مبني على bge-m3 ويوفر قدرات متعددة اللغات قوية تدعم أكثر من مجرد الصينية والإنجليزية.

هل BGE-m3 جيد؟

نعم، يُعتبر BGE-m3 أحد أفضل نماذج التضمين متعددة اللغات أداءً مع نتائج ممتازة على معايير مختلفة. يتفوق في الاسترجاع عبر اللغات ويوفر أداءً قويًا عبر لغات متعددة.

ما هو BGE-m3؟

BGE-m3 (BAAI General Embedding Multilingual-3) هو نموذج تضمين متعدد اللغات طورته BAAI ويدعم أكثر من 100 لغة. وهو مصمم لمهام متنوعة بما في ذلك استرجاع النصوص والتشابه الدلالي والتطبيقات عبر اللغات.

Novita AI هي منصة سحابية للذكاء الاصطناعي تقدم للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة التطبيقات البسيطة الخاصة بنا، مع توفير سحابة GPU ميسورة التكلفة وموثوقة للبناء والتوسع.