واجهة برمجة تطبيقات نموذج ERNIE 4.5 MoE من Baidu متاحة الآن على Novita AI

جدول المحتويات

ما هو ERNIE 4.5؟
الأداء والقدرات
الابتكارات التقنية
النشر والتكامل
كيفية الوصول إلى ERNIE 4.5-300B-A47B على Novita AI
الخاتمة

نموذج ERNIE 4.5، نموذج خليط الخبراء (MoE) مفتوح الأوزان والمتطور من Baidu، أصبح الآن متاحًا على Novita AI!

إليك أسعار ERNIE 4.5 الحالية على Novita AI:

baidu/ernie-4.5-vl-28b-a3b**: سياق 30 ألف، مجاني

baidu/erine-4.5–21B-a3b**: سياق 120 ألف، مجاني

baidu/erine-4.5–0.3b**: سياق 120 ألف، مجاني

baidu/erine-4.5-vl-424b-a47b**: سياق 123 ألف، 0.42 دولار/مليون رمز إدخال، 1.25 دولار/مليون رمز إخراج

baidu/ernie-4.5–300b-a47b-paddle**: سياق 123 ألف، 0.3 دولار/مليون رمز إدخال، 1 دولار/مليون رمز إخراج

جرب نموذج ERNIE-4.5-300B-A47B الآن

ما هو ERNIE 4.5؟

ERNIE 4.5 هو أحدث سلسلة نماذج مفتوحة المصدر من Baidu، وتضم 10 نماذج مختلفة. تشمل التشكيلة نماذج خليط الخبراء (MoE) ذات 47 مليارًا و3 مليارات معامل مُفعّل—يصل أكبر نموذج إلى إجمالي 424 مليار معامل—بالإضافة إلى نموذج كثيف بـ0.3 مليار معامل.

الابتكار المعماري: تستخدم هذه النماذج هيكل نموذج متعدد الوسائط غير متجانس مبتكر يحقق دمج المعرفة عبر الوسائط من خلال آلية مشاركة المعاملات عبر الوسائط، مع الحفاظ على مساحات معاملات مخصصة لكل وسيط على حدة. هذه البنية مناسبة جدًا لنموذج ما قبل التدريب المستمر من نماذج اللغة الكبيرة إلى النماذج متعددة الوسائط، مما يعزز بشكل كبير قدرات الفهم متعدد الوسائط مع الحفاظ على أداء مهام النص أو تحسينه.

الإطار والتدريب: يتم تدريب جميع نماذج سلسلة ERNIE 4.5 واستنتاجها ونشرها بكفاءة باستخدام إطار التعلم العميق PaddlePaddle. أثناء ما قبل التدريب لنموذج اللغة الكبير، تصل نسبة استخدام FLOPs للنموذج (MFU) إلى 47%.

الأداء والقدرات

الإنجازات المعيارية: تظهر النتائج التجريبية أن هذه السلسلة من النماذج تحقق أداءً متطورًا (SOTA) عبر معايير نصية ومتعددة الوسائط متعددة، مع نتائج بارزة بشكل خاص في:

اتباع التعليمات - فهم وتنفيذ الأوامر المعقدة
الاحتفاظ بالمعرفة العالمية - تخزين واستدعاء الحقائق الشاملة
الفهم البصري - قدرات متقدمة في فهم الصور
مهام الاستدلال متعدد الوسائط - استدلال معقد عبر المدخلات النصية والبصرية

مواصفات النموذج (ERNIE-4.5-300B-A47B):

إجمالي المعاملات: 300 مليار مع 47 مليار مُفعّل لكل رمز
البنية: 54 طبقة، 64 رأس استعلام / 8 رؤوس مفتاح-قيمة
تكوين الخبراء: 64 خبيرًا نصيًا (8 مُفعلة) / 64 خبيرًا بصريًا (8 مُفعلة)
طول السياق: 131,072 رمزًا
الوسيط: نص مع قدرات تدريب متعددة الوسائط

سهولة الوصول والنشر:

ترخيص Apache 2.0 - أوزان النموذج مفتوحة المصدر لكل من البحث الأكاديمي والتطبيقات الصناعية
مجموعة أدوات تطوير صناعية - استنادًا إلى مجموعة PaddlePaddle الشاملة مع دعم ERNIEKit
توافق واسع مع الرقاقات - يعمل عبر منصات أجهزة متنوعة، مما يخفض الحواجز أمام ما بعد التدريب والنشر
أداء استدلال ممتاز - خيارات نشر متعددة تشمل FastDeploy وTransformers ودمج vLLM
تكميم مرن - خيارات 4 بت و2 بت وFP8 لمتطلبات الموارد المختلفة

الابتكارات التقنية

ما قبل التدريب لنموذج خليط الخبراء متعدد الوسائط

المنهج: يقوم ERNIE 4.5 بـ التدريب المشترك عبر الوسائط النصية والبصرية لالتقاط الاختلافات الدقيقة في المعلومات متعددة الوسائط بشكل أفضل، مما يحسن الأداء في توليد النصوص وفهم الصور ومهام الاستدلال متعدد الوسائط.

الابتكار: لتمكين التعزيز المتبادل بين الوسيطين أثناء التعلم مع منع أحد الوسيطين من إعاقة تعلم الآخر، تقترح Baidu هيكل نموذج خليط خبراء متعدد الوسائط غير متجانس مع:

توجيه معزول للوسائط لتخصيص الخبراء المتخصصين
فقدان التعامد للموجه لتعزيز تخصص الخبراء
فقدان التوازن للرموز متعددة الوسائط لتحقيق الاستخدام الأمثل للموارد عبر الوسائط

التحسين المتقدم: تضمن هذه الخيارات المعمارية تمثيل كلا الوسيطين بفعالية، مما يسمح بـ التعزيز والتحسين المتبادلين متعددي الوسائط أثناء التدريب.

إطار التدريب والاستدلال الفعال

تحسينات التدريب: لدعم التدريب الفعال لنماذج ERNIE 4.5، تقترح Baidu استراتيجيات التوازي غير المتجانس الهجين وموازنة التحميل الهرمية. من خلال تقنيات متقدمة متعددة، يحسنون بشكل كبير إنتاجية ما قبل التدريب:

توازي الخبراء داخل العقدة - معالجة متوازية محسنة داخل عقد الحوسبة
جدولة خطوط الأنابيب الفعالة في الذاكرة - إدارة ذكية للذاكرة أثناء التدريب
تدريب الدقة المختلطة FP8 - تقنيات دقة عددية متقدمة
إعادة الحساب الدقيقة - إعادة حساب إستراتيجية لكفاءة الذاكرة

اختراقات الاستدلال: لتحسين الاستدلال، يقترحون عدة طرق متطورة:

طريقة التعاون المتوازي متعدد الخبراء - معالجة تعاونية عبر خبراء النموذج
خوارزمية تكميم الترميز التلافيفي - تقنيات ترميز متقدمة للضغط
تكميم شبه بدون فقدان: تحقيق تكميم 4 بت وتكميم 2 بت مع تدهور طفيف في الأداء
فصل PD مع تبديل الأدوار الديناميكي - نشر تكيفي يمكنه استخدام الموارد بشكل كامل وتحسين أداء استدلال نماذج MoE من ERNIE 4.5

ما بعد التدريب الخاص بالوسيط

تحسين مخصص: لتلبية المتطلبات المختلفة في السيناريوهات العملية، تقوم Baidu بـ ضبط دقيق خاص بالوسيط على النماذج المدربة مسبقًا:

نماذج اللغة الكبيرة (LLMs):

تم تحسينها خصيصًا لـ الفهم والتوليد العام للغة

نماذج الرؤية واللغة (VLMs):

التركيز على فهم اللغة البصرية
دعم كلاً من وضع التفكير ووضع عدم التفكير

خط أنابيب تدريب متعدد المراحل: يستخدم كل نموذج ما بعد التدريب متعدد المراحل باستخدام تقنيات متقدمة:

SFT (التعلم بالإشراف الدقيق) - التعلم من الأمثلة تحت الإشراف
DPO (تحسين التفضيل المباشر) - التحسين المباشر بناءً على التفضيلات
UPO (تحسين التفضيل الموحد) - تقنية تحسين التفضيل الموحد الخاصة بـ Baidu

النشر والتكامل

يمكن نشر نماذج ERNIE-4.5 باستخدام FastDeploy أو Hugging Face Transformers أو vLLM. تسمح مستويات التكميم وأطر الخدمة المختلفة بتشغيل النماذج بكفاءة عبر مجموعة من إعدادات الأجهزة:

النماذج كاملة الدقة تتطلب العديد من وحدات GPU (عادةً 16 وحدة GPU بسعة ذاكرة 80 جيجابايت لكل منها).
النماذج المكممة (مثل WINT4 وW4A8C8 أو WINT2) تقلل بشكل كبير من احتياجات VRAM. على سبيل المثال، يمكن تشغيل WINT4 أو W4A8C8 على 4‑8 وحدات GPU بسعة 80 جيجابايت، بينما يتيح WINT2 النشر على GPU واحدة إذا كان لديك 141 جيجابايت على الأقل من VRAM.
دمج Transformers يسمح باستخدام مرن لكنه لا يزال يتطلب VRAM كبير للنماذج الكبيرة.
vLLM مثالي للاستدلال عالي الإنتاجية متعدد وحدات GPU. تساعد النماذج المكممة في التوافق ضمن ذاكرة GPU المتاحة.
أخذ عينات موصى به: درجة الحرارة = 0.8، Top-P = 0.8

كيفية الوصول إلى ERNIE 4.5-300B-A47B على Novita AI

البدء مع ERNIE 4.5-300B-A47B على Novita AI سهل وخالٍ من المخاطر. يحصل المستخدمون الجدد على $10 من الأرصدة المجانية—وهو كافٍ لاستكشاف ERNIE 4.5-300B-A47B دون تكاليف مسبقة.

استخدم بيئة الاختبار (Playground) (بدون حاجة لبرمجة)

وصول فوري: سجل، احصل على أرصدتك المجانية، وابدأ في تجربة ERNIE 4.5 ونماذج أخرى رائدة في ثوانٍ.

واجهة تفاعلية: اختبر المطالبات (prompts) والتفكير السلسلي (chain-of-thought) وشاهد النتائج في الوقت الفعلي.

مقارنة النماذج: تنقل بسهولة بين ERNIE 4.5 وQwen 3 وLlama 4 وDeepSeek والمزيد للعثور على الأنسب لاحتياجاتك.

التكامل عبر API (للمطورين)

قم بتوصيل ERNIE 4.5 بسلاسة مع التطبيقات وسير العمل وروبوتات الدردشة باستخدام واجهة REST API الموحدة من Novita AI. لا داعي لإدارة أوزان النماذج أو البنية التحتية—توفر Novita AI مجموعات أدوات SDK متعددة اللغات (Python وNode.js وcURL) وتحكمًا متقدمًا في المعاملات.

الخيار 1: تكامل API المباشر (مثال بـ Python)

curl "https://api.novita.ai/v3/openai/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer " \
  -d @- << 'EOF'
{
    "model": "baidu/ernie-4.5-300b-a47b-paddle",
    "messages": [
        {
            "role": "system",
            "content": كن مساعدًا مفيدًا
        },
        {
            "role": "user",
            "content": "مرحبًا!"
        }
from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "baidu/ernie-4.5-300b-a47b-paddle"
stream = True # أو False
max_tokens = 6000
system_content = "كن مساعدًا مفيدًا"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "مرحبًا!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
      "response_format": { "type": "text" },
    "max_tokens": 32768,
    "temperature": 1,
    "top_p": 1,
    "min_p": 0,
    "top_k": 50,
    "presence_penalty": 0,
    "frequency_penalty": 0,
    "repetition_penalty": 1
}
EOF

الخيار 2: سير العمل متعدد الوكلاء باستخدام OpenAI Agents SDK

قم ببناء أنظمة متقدمة متعددة الوكلاء بدمج Novita AI مع OpenAI Agents SDK:

تشغيل فوري: استخدم ERNIE 4.5 من Novita AI في أي سير عمل لـ OpenAI Agents
يدعم التسليم والتوجيه واستخدام الأدوات: صمم وكلاء يمكنهم التفويض والفرز أو تشغيل الوظائف، جميعها مدعومة بقدرات ERNIE 4.5
دمج Python: ببساطة وجه SDK إلى نقطة نهاية Novita (https://api.novita.ai/v3/openai) واستخدم مفتاح API الخاص بك

قم بتوصيل ERNIE 4.5 API على منصات الطرف الثالث

Hugging Face: استخدم ERNIE 4.5 في Spaces وخطوط الأنابيب أو مع مكتبة Transformers عبر نقاط نهاية Novita AI.
أطر الوكلاء والتنسيق: قم بتوصيل Novita AI بسهولة مع منصات شريكة مثل Continue وAnythingLLM وLangChain وDify وLangflow من خلال الموصلات الرسمية وأدلة التكامل خطوة بخطوة.
API متوافق مع OpenAI: استمتع بالهجرة والتكامل دون متاعب مع أدوات مثل Cline وCursor، المصممة لمعيار API الخاص بـ OpenAI.

الخاتمة

ERNIE 4.5 هي سلسلة نماذج ذكاء اصطناعي مفتوحة المصدر ومتعددة الاستخدامات تجمع بين بنية خليط الخبراء المتقدمة والتعلم المبتكر متعدد الوسائط. إنها تتيح أداءً قويًا وفعالًا عبر مهام اللغة والرؤية، مما يجعلها أساسًا قويًا لتطبيقات الذكاء الاصطناعي من الجيل التالي.

هل أنت مستعد لتجربة مستقبل التفكير بالذكاء الاصطناعي؟ جرب ERNIE 4.5 على Novita AI.

Novita AI هي منصة سحابية للذكاء الاصطناعي توفر للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة API البسيطة لدينا، مع توفير سحابة GPU موثوقة وبأسعار معقولة للبناء والتوسع.

واجهة برمجة تطبيقات نموذج ERNIE 4.5 MoE من Baidu متاحة الآن على Novita AI

ما هو ERNIE 4.5؟

الأداء والقدرات

الابتكارات التقنية