يتطابق MiniMax M2.5 مع نتيجة GLM 5 البالغة 77.8% في اختبار SWE-bench Verified بنتيجة 80.2% — بتكلفة API تبلغ ثلث التكلفة فقط على Novita AI. أُطلق النموذجان الصينيان من نوع MoE ضمن 24 ساعة من بعضهما البعض في فبراير 2026، ويتبعان نهجين مختلفين لوكلاء الذكاء الاصطناعي. يصل GLM 5 إلى 754 مليار معامل مع 40 مليار معامل نشط، ويستهدف هندسة الأنظمة المعقدة مع نافذة سياق تبلغ 200 ألف رمز واهتمام متفرع من DeepSeek. يحتفظ MiniMax M2.5 بـ 228.7 مليار معامل إجمالي مع قدرات كتابة المواصفات، مدرب عبر 200 ألف بيئة تعلم معزز (RL) واقعية. يعتمد الخيار على ما إذا كنت بحاجة إلى العمق المعماري لـ GLM 5 لجلسات تصحيح أخطاء تستمر لساعات، أو إلى التكلفة المنخفضة لـ M2.5 لخطوط أنابيب الوكلاء عالية الحجم.
نظرة عامة على نموذج MiniMax M2.5 و GLM 5
تُنشط بنية MoE الخاصة بـ GLM 5 البالغة 754 مليار معامل 40 مليار معامل لكل استدلال، مما يجعلها أكبر ب3.2 مرة من إجمالي معاملات M2.5 البالغ 228.7 مليار. يكشف هذا الفرق عن فلسفات تصميم متميزة تنتشر عبر كل بُعد من أبعاد الأداء.
| مكون البنية | GLM 5 | MiniMax M2.5 |
|---|---|---|
| إجمالي المعاملات | 754B (40B نشط) | 229B |
| بنية الخبراء | 256 خبير مُوجه، أعلى 8، خبير مشترك واحد | 256 خبير محلي، اختيار أعلى 8 |
| آلية الاهتمام | الاهتمام المتفرع من DeepSeek (DSA) | اهتمام قياسي |
| الطبقات المخفية | 78 طبقة، حجم مخفي 6144 | 62 طبقة، حجم مخفي 3072 |
| نافذة السياق | 202,752 رمز (200K) | 196,608 رمز (197K) |
| بيانات التدريب | 28.5 تريليون رمز | غير معلن |
| إطار عمل التعلم المعزز | Slime (تعلم معزز غير متزامن) | Forge (تعلم معزز أصيل للوكلاء، أكثر من 200 ألف بيئة) |
يُعد الاهتمام المتفرع من DeepSeek (DSA) الميزة المعمارية الرئيسية لـ GLM 5. فهو يحافظ على أداء عالٍ للسياقات الطويلة مع خفض تكاليف النشر. يبدو الفرق بين نافذة السياق 202K و 197K صغيراً على الورق، لكن DSA الخاص بـ GLM 5 يحافظ على التماسك عبر هذه النافذة الكاملة دون تكاثف ذاكرة تربيعي. يعوض MiniMax M2.5 ذلك بكفاءة تفكيك المهام بدلاً من السعة الخام للسياق.
مقدمة DSA بواسطة kaitchup
مقدمة Forge بواسطة MiniMax
يروي فجوة تدريب التعلم المعزز قصة أعمق. يتيح إطار عمل Slime الخاص بـ GLM 5 التعلم المعزز غير المتزامن على نطق غير مسبوق، مع دفع حدود التدريب المسبق والتدريب اللاحق في آن واحد. يفصل إطار عمل Forge الخاص بـ MiniMax محرك التدريب عن الوكلاء تماماً، مع التحسين من أجل التعميم عبر الهياكل بدلاً من إتقان مهمة واحدة. أنت تختار بين نموذج مدرب للتعامل مع أي شيء يُلقى إليه (GLM 5) ونموذج مدرب في البيئات الدقيقة التي سيواجهها وكلاؤك (أكثر من 200 ألف سيناريو تدريب واقعي لـ M2.5).
جرّب GLM 5 و MiniMax M2.5 الآن!
مقارنة مباشرة للبرمجة بين MiniMax M2.5 و GLM 5
تتفوق نتيجة M2.5 البالغة 80.2% في اختبار SWE-bench Verified على نتيجة GLM 5 البالغة 77.8%، مما يضع كلا النموذجين على مسافة قريبة من نتيجة Claude Opus 4.6 البالغة 80.9%.
| معيار البرمجة | GLM 5 | MiniMax M2.5 | ما يقيسه |
|---|---|---|---|
| SWE-bench Verified | 77.8% | 80.2% | حل طلبات السحب (PR) الحقيقية من GitHub |
| SWE-bench Multilingual | 73.3% | 74.1% | إصلاح الأخطاء عبر اللغات المختلفة |
| Terminal-Bench 2.0 | 56.2% | 51.7% | معالجة بيئة واجهة الأوامر (CLI) |
تظهر الفجوة في طريقة تحقيق كل منهما لنتائج متشابهة. تكشف الاختبارات الخاضعة للرقابة من Kilo AI النمط: يتفوق GLM 5 في الهندسة الوكيلية — دورات تصحيح الأخطاء التكرارية التي يعكس فيها النموذج أخطاء المترجم ويعيد هيكلة الكود حتى تنجح الاختبارات. حصل على نتيجة كاملة 35/35 في اختبار API-from-spec من خلال كتابة 94 حالة اختبار، وإنشاء وسيط قابل لإعادة الاستخدام، واستخدام أنماط قواعد بيانات قياسية. لا توجد أخطاء عبر ثلاث عمليات تشغيل مستقلة.
يفوز M2.5 في كتابة المواصفات — النهج المعماري. قبل لمس الكود، يفكك الميزات إلى بنية، وتصميم واجهة مستخدم، وحدود النظام. في مهمة البحث عن الأخطاء، وثق M2.5 كل إصلاح بتعليقات مضمنة وحفظ جميع عقود API الأصلية، محققاً نتيجة 28/30 مقابل 24.5/30 لـ GLM 5. العيب: أكمل M2.5 جميع الاختبارات في 21 دقيقة مقابل 44 دقيقة لـ GLM 5، لكنه أنتج خطأ تفويض حرج في نقطة نهاية المرفقات الذي كان سيكتشفه الاختبار الشامل لـ GLM 5.

اختبار من Kilo Code
الاستنتاج الرئيسي: تبرز حلقات التأمل الذاتي لـ GLM 5 عندما تبني من الصفر وتحتاج إلى كود خالٍ من العيوب. يهيمن التخطيط المسبق لـ M2.5 عند العمل مع قواعد كود قديمة حيث التغييرات الطفيفة والتوثيق الواضح أهم من الهندسة المعمارية المثالية. يذكر المطورون الحقيقيون أن M2.5 يتطلب مزيداً من المتابعة لكنه ينتهي أسرع، بينما يتوافق GLM 5 بشكل أفضل مع النية على حساب حدود المعدل العرضية. يبني GLM 5 أكثر ويختبر أكثر. يغير MiniMax M2.5 أقل وينتهي أسرع.
https://www.youtube.com/watch?v=t94H-DkFIys
جرّب GLM 5 و MiniMax M2.5 الآن!
أداء المهام الوكيلية لـ MiniMax M2.5 و GLM 5
يهيمن GLM 5 على معايير استدعاء الأدوات. يحصل على 67.8% في MCP-Atlas (المجموعة العامة)، 38% في Tool-Decathlon، و 89.7% في τ²-Bench. هذه ليست اختبارات استدعاء دوال عامة؛ إنها تقيس ما إذا كان الوكيل يستطيع ربط 5-10 استدعاءات أدوات لحل مهام بحث حقيقية.
تظهر ميزة M2.5 في كفاءة اتخاذ القرار. عبر BrowseComp و Wide Search و RISE، يحقق M2.5 نتائج أفضل باستخدام 20% أقل من جولات البحث مقارنة بـ M2.1. تعلم حل المشاكل باستخدام استعلامات أكثر دقة بدلاً من الاستكشاف الشامل. تتضاعف هذه الكفاءة في الإنتاج: عندما يعمل وكيلك على 1000 مهمة بحث يومياً، تقلل كفاءة الرموز لـ M2.5 التكاليف بنسبة 20% حتى قبل حساب أسعار API الأقل الخاصة به.
| معيار الوكيل | GLM 5 | MiniMax M2.5 | سيناريو الاختبار |
|---|---|---|---|
| BrowseComp (مع إدارة السياق) | 75.9% | 75.1%~76.3% | تصفح حقيقي مع استراتيجية تجاهل السجل |
| RISE (داخلي) | غير معلن | 50.2% | مهام بحث احترافية |
| BFCL | غير معلن | 76.8% | |
| τ²-Bench | 89.7% | غير معلن | اختيار الأدوات وتسلسلها |
| MCP-Atlas (المجموعة العامة) | 67.8% | غير معلن | مهام تكامل خادم MCP |
تحليل التكاليف لـ MiniMax M2.5 و GLM 5
يكلف M2.5 0.30 دولار للإدخال / 1.20 دولار للإخراج لكل مليون رمز، مما يقلل من تكلفة GLM 5 المقدرة بـ 1.00 دولار للإدخال / 3.20 دولار للإخراج بنسبة 70% للإدخال و 62.5% للإخراج. تشغيل M2.5 بشكل مستمر يكلف 1 دولار في الساعة (8760 دولار في السنة). تضع أسعار GLM 5 التشغيل المستمر حول 2.80 دولار في الساعة (24528 دولار في السنة) — أي 2.8 ضعف أكثر لنفس وقت التشغيل.
| سيناريو التكلفة | GLM 5 | MiniMax M2.5 | MiniMax M2.5 عالي السرعة |
|---|---|---|---|
| أسعار API (1M رمز) | 1.00 دولار إدخال / 3.20 دولار إخراج | 0.30 دولار إدخال / 1.20 دولار إخراج | 0.60 دولار إدخال / 2.4 دولار إخراج |
| قراءة ذاكرة التخزين المؤقت | 0.2 دولار / مليون رمز | 0.03 دولار / مليون رمز | 0.03 دولار / مليون رمز |
| استخدام OpenClaw اليومي (500K إدخال / 100K إخراج) | 0.82 دولار/يوم | 0.27 دولار/يوم | 0.54 دولار/يوم |
قراءة ذاكرة التخزين المؤقت تشير إلى تكلفة قراءة الرموز التي تم تخزينها مسبقاً في ذاكرة التخزين المؤقت للمطالبات. عندما يُعاد استخدام نفس محتوى المطالبة عبر الطلبات، يسترد النموذج هذه الرموز مباشرة من الذاكرة المؤقتة بدلاً من معالجتها مرة أخرى من الصفر. هذا يقلل من كل من زمن الاستدلال والتكاليف.
جرّب GLM 5 و MiniMax M2.5 الآن!
توصيات حالات الاستخدام لـ MiniMax M2.5 و GLM 5
اختر MiniMax M2.5 عندما تكون هيمنة السرعة-التكلفة أهم من المرونة المعمارية. تستفيد الوكلاء الموجهون للعملاء الذين يحتاجون إلى استجابات أقل من الثانية على نطاق واسع — روبوتات المحادثة التي تعالج أكثر من 10 آلاف محادثة يومياً، إكمال الكود عبر فرق المطورين، إنشاء توثيق تلقائي — جميعها من الإنتاجية العالية لـ M2.5 وتكلفة API الأقل ب3 مرات.
اختر GLM 5 عندما يتجاوز العمق المعماري واحتياجات التخصيص قيود التكلفة. تفضل بيئات البحث التي تتطلب سياق قاعدة كود كاملة، أو جلسات تصحيح أخطاء تستمر لساعات، أو التكامل مع مكدسات أدوات مخصصة نافذة السياق 200K لـ GLM 5 وهيمنته على MCP-Atlas/Tool-Decathlon. تحافظ مقياس 754 مليار معامل مع الاهتمام المتفرع من DeepSeek على التماسك عبر مهام هندسة الأنظمة المعقدة التي من شأنها أن تجعل M2.5 يفقد السياق في منتصف الجلسة.
| فئة حالة الاستخدام | GLM 5 | MiniMax M2.5 | العامل الحاسم |
|---|---|---|---|
| وكلاء موجهون للعملاء | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | سعر API منخفض |
| هندسة أنظمة معقدة | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | سياق 200K + DSA لجلسات تستمر لساعات |
| أتمتة عالية الحجم (أكثر من 10 آلاف مهمة/يوم) | ⭐⭐ | ⭐⭐⭐⭐⭐ | API أرخص ب3 مرات = 3 مرات مهام أكثر لكل دولار |
| تطوير استكشافي | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | وقت المهمة 21 دقيقة لـ M2.5 مقابل 44 دقيقة لـ GLM 5 في اختبار كيلو |
| تكامل مكدس أدوات مخصص | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | 67.8% في MCP-Atlas، 89.7% في τ²-Bench |
| صيانة قواعد كود متعددة اللغات | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | 73.3% مقابل 51.3% في SWE-bench متعدد اللغات |
| إنتاجية المكتب (Word/Excel/PPT) | ⭐⭐ | ⭐⭐⭐⭐⭐ | معدل فوز 59% مقابل النماذج السائدة (GDPval-MM) |
جرّب GLM 5 و MiniMax M2.5 الآن!
كيفية الوصول إلى كلا النموذجين عبر Novita AI؟
الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج
سجل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

الخطوة 2: اختر النموذج الخاص بك
تصفح الخيارات المتاحة واختر النموذج الذي يناسب احتياجاتك.

الخطوة 3: ابدأ تجربتك المجانية
ابدأ تجربتك المجانية لاستكشاف قدرات النموذج المحدد.

جرّب GLM 5 و MiniMax M2.5 الآن!
الخطوة 4: احصل على مفتاح API الخاص بك
للمصادقة مع API، سنزودك بمفتاح API جديد. عند الدخول إلى صفحة "الإعدادات"، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

الخطوة 5: تثبيت API
ثبت API باستخدام مدير الحزم الخاص بلغة البرمجة الخاصة بك.
بعد التثبيت، استورد المكتبات الضرورية إلى بيئة التطوير الخاصة بك. قم بتهيئة API باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال على استخدام API لإكمال المحادثات لمستخدمي بايثون.
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="zai-org/glm-5 or minimax/minimax-m2.5",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=131072,
temperature=0.7
)
print(response.choices[0].message.content)
اختبار السؤال الواحد: هل تحتاج إلى تخصيص أم مجرد أداء؟ إذا كان سير العمل الخاص بك يتطلب ضبطاً دقيقاً، أو استضافة ذاتية، أو تكامل مع مكدسات أدوات مملوكة → فإن المرونة المعمارية لـ GLM 5 وترخيص MIT يبرران السعر المرتفع. إذا كنت تطلق وكلاء يحتاجون إلى التوسع إلى ملايين الاستدعاءات بدون قيود ميزانية → تصبح ذكاء M2.5 منخفض التكلفة ميزتك التنافسية. أجبر مشهد النماذج المفتوحة الصيني كل منافس على إعادة معايرة ما يعنيه "الذكاء الاصطناعي بأسعار معقولة" في 2026.
الأسئلة الشائعة
أي نموذج أفضل لمهام البرمجة، MiniMax M2.5 أم GLM 5؟
يتفوق MiniMax M2.5 في مهام البرمجة بنتيجة 80.2% في اختبار SWE-bench Verified، متفوقاً بشكل طفيف على GLM 5.
أي نموذج أفضل لسير العمل الوكيلية، GLM 5 أم MiniMax M2.5؟
يتفوق GLM 5 في سير العمل الوكيلية المعقدة بنتائج أقوى في HLE مع الأدوات و Terminal-Bench مقارنة بـ MiniMax M2.5.
هل يمكن تشغيل MiniMax M2.5 و GLM 5 على بطاقات رسوم للمستهلكين؟
يتطلب كل من MiniMax M2.5 و GLM 5 ذاكرة وصول عشوائي للرسوميات (VRAM) كبيرة، ويتم الوصول إليهما عادةً عبر واجهات برمجة التطبيقات (APIs) بدلاً من بطاقات الرسوم للمستهلكين.
Novita AI هي منصة سحابية للذكاء الاصطناعي والوكلاء تساعد المطورين والشركات الناشئة على بناء ونشر وتوسيع نطاق النماذج والتطبيقات الوكيلية بأداء عالٍ، وموثوقية، وكفاءة في التكاليف.
قراءات موصى بها

مقدمة DSA بواسطة 