GLM-5 مقابل GLM-4.7: القوة الوكيلية مقابل كفاءة البرمجة

جدول المحتويات

مقارنة البنية المعمارية بين GLM-5 وGLM-4.7
مقارنة المعايير بين GLM-5 وGLM-4.7
متطلبات VRAM لـ GLM-5 وGLM-4.7
التسعير والوصول عبر API لـ GLM-5 وGLM-4.7
ملخص إطار القرار لـ GLM-5 وGLM-4.7

غالباً ما يتلخص الاختيار بين GLM-5 وGLM-4.7 في مفاضلة حرجة: القوة الوكيلية الهائلة مقابل البراعة المثبتة في البرمجة متعددة الاستخدامات. يرتقي GLM-5، الذي أصدرته Z.ai، بشكل كبير عن سابقه، قافزاً من 355 مليار معامل (32 مليار نشط) في GLM-4.7 إلى 753.9 مليار معامل (40 مليار نشط). هذا التوسع بمقدار 2.1 ضعف في المعاملات يحقق تحسينات جوهرية في هندسة الأنظمة المعقدة والمهام الوكيلية طويلة المدى، لكن GLM-4.7 لا يزال قوة هائلة في البرمجة متعددة اللغات، وأتمتة الطرفية، وسير عمل المطورين الواقعي.

مقارنة البنية المعمارية بين GLM-5 وGLM-4.7

المواصفة	GLM-5	GLM-4.7
إجمالي المعاملات	753.9 مليار	355 مليار
المعاملات النشطة	40 مليار	32 مليار
طول السياق	202,752 رمز	202,752 رمز
بيانات ما قبل التدريب	28.5 تريليون رمز	23 تريليون رمز
الدقة	BF16 (FP8 متاح)	BF16 (FP8 متاح)
دعم الوسائط المتعددة	نص فقط	نص فقط
تاريخ الإصدار	يناير 2026	ديسمبر 2025

من أبرز التحسينات العملية في GLM-5 هو دمج DeepSeek Sparse Attention (DSA)، مما يقلل بشكل كبير من تكلفة الانتباه طويل السياق مع الحفاظ على نوافذ سياق كبيرة تصل إلى 202 ألف رمز. وهذا يجعل GLM-5 أكثر قابلية للنشر في سير العمل الواقعي للاستدلال على المستندات الطويلة، والمساعدات متعددة الأدوار، وسير العمل الوكيلي.على جانب ما بعد التدريب، يستفيد GLM-5 من slime، وهي بنية تحتية جديدة للتعلم المعزز غير المتزامن تعزز إنتاجية تدريب RL وتتيح تكرارات محاذاة أكثر تكراراً ودقة.

جرب GLM-5 الآن!

مقارنة المعايير بين GLM-5 وGLM-4.7

من منظور المعايير، يظهر GLM-5 تحسناً واسعاً ومتسقاً مقارنة بـ GLM-4.7، خاصة في استخدام الأدوات والتصفح والإعدادات الوكيلية. تظهر أكبر المكاسب في البيئات التي تتطلب تخطيطاً متعدد الخطوات، وإدارة السياق، والتنفيذ في العالم الحقيقي، مما يشير إلى أن GLM-5 محسّن لـ سير العمل الوكيلية بدلاً من مهام الاستدلال المعزولة.

GLM-4.7 يعمل كنموذج استدلال/برمجة محسّن للكفاءة، لا يزال قوياً جداً في تقييمات الرياضيات التقليدية، ولكنه أقل هيمنة في المهام التفاعلية القائمة على الأدوات.

جرب GLM-5 الآن!

متطلبات VRAM لـ GLM-5 وGLM-4.7

الزيادة بمقدار 2.1 ضعف في المعاملات من GLM-4.7 إلى GLM-5 تستلزم تبعيات كبيرة على الأجهزة. فيما يلي تفصيل متطلبات VRAM:

تكوين GPU الموصى به لـ GLM-5

الدقة	VRAM المطلوبة	الإعداد الموصى به	حالة الاستخدام
BF16	1,508 جيجابايت	19x NVIDIA H100 (80 جيجابايت)	أقصى جودة للبحث
FP8	حوالي 800 جيجابايت	10x NVIDIA H100 (80 جيجابايت)	نشر الإنتاج
INT4	حوالي 400 جيجابايت	5x H100 (80 جيجابايت)	استدلال فعال من حيث التكلفة

تكوين GPU الموصى به لـ GLM-4.7

الدقة	VRAM المطلوبة	الإعداد الموصى به	حالة الاستخدام
BF16	717 جيجابايت	9x NVIDIA H100 (80 جيجابايت)	أقصى جودة
FP8	390 جيجابايت	5x H100 (80 جيجابايت)	نشر الإنتاج
INT4	200 جيجابايت	3x H100 (80 جيجابايت)	استدلال فعال من حيث التكلفة

جرب GPU فعال من حيث التكلفة الآن!

في نشر FP8، عادةً ما يتطلب GLM-5 ضعف عدد وحدات GPU مقارنة بـ GLM-4.7.

للمطورين ذوي الميزانيات المحدودة، يقدم GLM-4.7 ملف أداء أفضل لكل دولار في أعباء العمل المركزة على البرمجة، محققاً 73.8% على SWE-bench Verified و84.9% على LiveCodeBench-v6.

للبحث الحدودي وتطوير الأنظمة الوكيلية، يمكن أن تبرر قدرات GLM-5 الأقوى في استخدام الأدوات والتنفيذ طويل المدى الاستثمار الإضافي في الأجهزة.

التسعير والوصول عبر API لـ GLM-5 وGLM-4.7

النموذج	الإدخال ($ / مليون رمز)	قراءة ذاكرة التخزين المؤقت ($ / مليون رمز)	الإخراج ($ / مليون رمز)
GLM-4.7	$0.60	$0.11	$2.20
GLM-5	$1.00	$0.20	$3.20

قراءة ذاكرة التخزين المؤقت تشير إلى تكلفة قراءة الرموز التي تم تخزينها مسبقاً في ذاكرة التخزين المؤقت للمطالبة. عند إعادة استخدام نفس محتوى المطالبة عبر الطلبات، يسترجع النموذج هذه الرموز مباشرة من ذاكرة التخزين المؤقت بدلاً من معالجتها من جديد. وهذا يقلل من زمن الانتقال والتكلفة في الاستدلال.

الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج

سجل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

الخطوة 2: اختر نموذجك

تصفح الخيارات المتاحة واختر النموذج الذي يناسب احتياجاتك.

الخطوة 3: ابدأ نسختك التجريبية المجانية

ابدأ النسخة التجريبية المجانية لاستكشاف إمكانيات النموذج المحدد.

جرب GLM-5 الآن!

الخطوة 4: احصل على مفتاح API الخاص بك

لمصادقة الوصول إلى API، سنوفر لك مفتاح API جديد. بالدخول إلى صفحة “الإعدادات”، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

الخطوة 5: تثبيت API

قم بتثبيت API باستخدام مدير الحزم الخاص بلغة البرمجة التي تستخدمها.

بعد التثبيت، قم باستيراد المكتبات اللازمة في بيئة التطوير الخاصة بك. قم بتهيئة API باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال على استخدام API لاستكمال المحادثة لمستخدمي Python.

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="zai-org/glm-5 or zai-org/glm-4.7",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=131072,
    temperature=0.7
)

print(response.choices[0].message.content)

ملخص إطار القرار لـ GLM-5 وGLM-4.7

السيناريو	النموذج الموصى به	السبب الرئيسي
أنظمة متعددة الوكلاء مع تنسيق الأدوات	GLM-5	+15.8pp على MCP-Atlas، +14.2pp على Tool-Decathlon
سير عمل SWE-bench الإنتاجي	GLM-4.7	73.8% بنصف تكلفة الأجهزة
الأمن السيبراني واختبار الاختراق	GLM-5	43.2% CyberGym
البرمجة في بيئة التطوير المتكاملة (Claude Code, Cline)	GLM-4.7	الحفاظ على التفكير + زمن انتقال أقل
أبحاث الاستدلال الحدودي (HLE)	GLM-5	50.4% مع الأدوات (أفضل نموذج مفتوح المصدر)
البرمجة الموجهة بالواجهات / “vibe coding”	GLM-4.7	تدريب متخصص لواجهات الويب الحديثة
أتمتة الطرفية (طويلة المدى)	GLM-5	+28.3pp على Terminal-Bench 2.0
مسابقات الرياضيات (AIME, HMMT)	GLM-4.7	يساوي/يتجاوز GLM-5 بتكلفة أقل
الشركات الناشئة ذات الميزانية المحدودة	GLM-4.7	برمجة قوية مع 4x H100 مقابل 8x H100
مختبرات الأبحاث التي تدفع حدود AGI	GLM-5	تدريب مسبق على 28.5 تريليون رمز، بنية تحتية للتعلم المعزز slime

جرب GLM-5 الآن!

GLM-5 لا يلغي GLM-4.7—إنه يعالج مشاكل مختلفة. إذا كان عملك يتضمن مهام وكيلية طويلة المدى تتطلب استخداماً واسعاً للأدوات واستدلالاً متعدد الخطوات، فإن الاستثمار المضاعف في الأجهزة في GLM-5 يؤتي ثماره في معدلات إنجاز المهام. إذا كنت تقوم بتسليم مساعدي برمجة لآلاف المطورين أو تحتاج إلى دورات تكرار سريعة في بيئات IDE، فإن بنية GLM-4.7 الأنحف والتدريب المتخصص يجعله الخيار الأنسب. كلا النموذجين يمثلان إنجازات هامة في النمذجة اللغوية مفتوحة المصدر، مما يقلص الفجوة مع النماذج الخاصة الحدودية مع الحفاظ على الشفافية الكاملة ومرونة النشر المحلي.

الأسئلة الشائعة

ما الفرق المعماري الرئيسي بين GLM-5 وGLM-4.7؟

يرتقي GLM-5 من 355 مليار إلى 753.9 مليار معامل إجمالي (32 مليار إلى 40 مليار نشط) ويدمج DeepSeek Sparse Attention (DSA) لتقليل تكاليف النشر مع الحفاظ على طول سياق 202 ألف رمز.

هل يمكنني تشغيل GLM-5 على أجهزة المستهلك؟

لا. يتطلب GLM-5 ما لا يقل عن 10 وحدات GPU من نوع H100 بسعة 80 جيجابايت في وضع FP8 (800 جيجابايت VRAM)، وهو ما يتجاوز بكثير إمكانيات أجهزة المستهلك.

أي النموذجين أفضل لمهام البرمجة على SWE-bench؟

يتفوق GLM-5 على GLM-4.7 بنسبة 77.8% على SWE-bench Verified (+4 نقاط مئوية)، لكن تحقيق GLM-4.7 لنسبة 73.8% بنصف تكلفة الأجهزة يجعله أكثر عملية للإنتاج.

Novita AI هي منصة حوسبة سحابية للذكاء الاصطناعي تقدم للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام API بسيط، مع توفير حوسبة GPU موثوقة وبأسعار معقولة للبناء والتوسع.

قراءات موصى بها

GLM-5 مقابل GLM-4.7: القوة الوكيلية مقابل كفاءة البرمجة

مقارنة البنية المعمارية بين GLM-5 وGLM-4.7

مقارنة المعايير بين GLM-5 وGLM-4.7

متطلبات VRAM لـ GLM-5 وGLM-4.7

التسعير والوصول عبر API لـ GLM-5 وGLM-4.7

ملخص إطار القرار لـ GLM-5 وGLM-4.7

الأسئلة الشائعة

Product

RESOURCES

Partners

Company

مقارنة البنية المعمارية بين GLM-5 وGLM-4.7

مقارنة المعايير بين GLM-5 وGLM-4.7

متطلبات VRAM لـ GLM-5 وGLM-4.7

التسعير والوصول عبر API لـ GLM-5 وGLM-4.7

ملخص إطار القرار لـ GLM-5 وGLM-4.7

الأسئلة الشائعة

مقالات ذات صلة

Product

RESOURCES

Partners

Company