بدء استخدام واجهة GLM 5.2 API على Novita AI

جدول المحتويات

متطلبات البدء السريع لواجهة GLM 5.2 API
مواصفات GLM 5.2 API والتسعير
كيفية إجراء أول طلب GLM 5.2 API
متى تستخدم GLM 5.2
استدعاء الدوال والمخرجات المنظمة
ملاحظات إنتاجية لاستخدام السياق الطويل
الأسئلة الشائعة
مقالات مقترحة

يشرح هذا الدليل السريع كيفية استدعاء GLM 5.2 على Novita AI من خلال واجهة برمجة تطبيقات الدردشة المتوافقة مع OpenAI. استخدم معرف النموذج المؤكد zai-org/glm-5.2، عنوان URL الأساسي لـ Novita AI، وأرسل طلبًا صغيرًا أولًا قبل اختبار نافذة السياق البالغة 1,048,576 رمزًا، والحد الأقصى للإخراج البالغ 131,072 رمزًا، واستدعاء الدوال، والمخرجات المنظمة، ودعم التفكير، أو الوصول المتوافق مع Anthropic كما هو موضح في قائمة النموذج الحالية.

متطلبات البدء السريع لواجهة GLM 5.2 API

GLM 5.2 هو النموذج الرائد من Z.AI للعمل المستقل طويل المدى. تصف صفحة نموذج Novita AI أنه نموذج مصمم للمهام المستمرة مثل التخطيط والتنفيذ والتحسين التكراري والبرمجة وتقديم نتائج على مستوى الإنتاج. بالنسبة للمطورين، النقطة العملية بسيطة: GLM 5.2 ليس مجرد نموذج محادثة قصير آخر. إنه موجه لسير العمل حيث يحتاج النموذج إلى سياق كافٍ لإبقاء مهمة كبيرة، أو قاعدة بيانات، أو مجموعة مستندات، أو حالة وكيل في الأفق.

على Novita AI، يتم عرض GLM 5.2 من خلال واجهات برمجة تطبيقات النماذج بدون خادم (serverless). هذا مهم إذا كنت تريد تقييم النموذج دون إنشاء بنية تحتية لوحدة معالجة الرسومات (GPU)، أو توجيه حركة المرور عبر مجموعة استدلال مخصصة، أو إدارة خدمة السياق الطويل بنفسك. تستخدم مفتاح API الخاص بـ Novita AI، ونقطة النهاية المتوافقة مع OpenAI، ومعرف النموذج الدقيق:

zai-org/glm-5.2

يشرح دليل واجهة برمجة تطبيقات LLM من Novita AI الحالي نهج المنصة المتوافق مع OpenAI لمهام الدردشة والإكمال. ويوثق مرجع واجهة برمجة تطبيقات إكمال الدردشة مسار REST المستخدم في الأمثلة أدناه:

https://api.novita.ai/openai/v1/chat/completions

استخدم صفحة النموذج للحصول على التفاصيل الخاصة بالنموذج مثل طول السياق، الحد الأقصى للإخراج، التسعير، الوسائط، وعائلات نقاط النهاية المدعومة. استخدم مرجع API لمعاملات الطلب، المصادقة، البث، وهيكل رسائل الدردشة.

مواصفات GLM 5.2 API والتسعير

يظهر الإدراج الحالي لـ Novita AI لـ GLM 5.2 نموذجًا بدون خادم لإدخال نص وإخراج نص مع دعم السياق الطويل والميزات الموجهة للوكيل.

الحقل	القيمة الحالية لـ Novita AI
اسم العرض	GLM 5.2
معرف API للنموذج	`zai-org/glm-5.2`
مسار الوصول	بدون خادم
نافذة السياق	1,048,576 رمزًا
الحد الأقصى للإخراج	131,072 رمزًا
وسائط الإدخال	نص
وسائط الإخراج	نص
عائلات نقاط النهاية	`chat/completions`, نقطة نهاية متوافقة مع Anthropic
استدعاء الدوال	مدعوم
المخرجات المنظمة	مدعومة
التفكير	مدعوم
سعر الإدخال	$1.40 لكل مليون رمز
سعر إدخال القراءة المخزنة مؤقتًا	$0.26 لكل مليون رمز
سعر الإخراج	$4.40 لكل مليون رمز

يتم تحديد الأسعار لكل مليون رمز. لتقدير سريع، اضرب رموز المطالبة (prompt tokens) في معدل الإدخال والرموز المولدة في معدل الإخراج. يمكن أن يقلل سعر القراءة المخزنة مؤقتًا من التكلفة عندما يرسل تطبيقك نفس السياق القابل لإعادة الاستخدام بشكل متكرر، مثل مطالبة النظام، مخطط الأداة، كتلة السياسة، أو ملخص المستودع المستقر.

على سبيل المثال، طلب يحتوي على 100,000 رمز إدخال غير مخزنة مؤقتًا و5000 رمز إخراج سيكون تقديره كما يلي:

المكون	الحساب	التكلفة المقدرة
الإدخال	0.1 مليون رمز × $1.40	$0.14
الإخراج	0.005 مليون رمز × $4.40	$0.022
الإجمالي	إدخال + إخراج	$0.162

هذا مجرد تقدير بسيط لمعدل الرموز. تعتمد التكلفة الإنتاجية أيضًا على إعادة استخدام المطالبات، إعادة المحاولات، الاقتطاع، سلوك البث، طول الاستجابة، وما إذا كان تطبيقك يتضمن بشكل متكرر كتل سياق كبيرة يمكن تخزينها مؤقتًا أو تلخيصها.

كيفية إجراء أول طلب GLM 5.2 API

ابدأ بمطالبة صغيرة قبل اختبار نافذة السياق الكاملة 1M-token. يمنحك ذلك خط أساس نظيف للمصادقة، توجيه النموذج، شكل الاستجابة، وزمن الانتقال.

قم بتثبيت OpenAI Python SDK وقم بتخزين مفتاح Novita AI الخاص بك في متغير بيئة:

pip install openai
export NOVITA_API_KEY="YOUR_NOVITA_API_KEY"

ثم قم باستدعاء GLM 5.2 باستخدام عنوان URL الأساسي لـ Novita AI:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["NOVITA_API_KEY"],
    base_url="https://api.novita.ai/openai",
)

response = client.chat.completions.create(
    model="zai-org/glm-5.2",
    messages=[
        {
            "role": "system",
            "content": "You are a practical software architecture assistant.",
        },
        {
            "role": "user",
            "content": "Review this migration plan and list the highest-risk steps.",
        },
    ],
    max_tokens=1200,
    temperature=0.3,
)

print(response.choices[0].message.content)

إذا كنت تفضل استدعاء REST مباشر، استخدم مسار إكمال الدردشة:

curl --request POST \
  --url https://api.novita.ai/openai/v1/chat/completions \
  --header "Authorization: Bearer $NOVITA_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "zai-org/glm-5.2",
    "messages": [
      {
        "role": "system",
        "content": "You are a concise engineering reviewer."
      },
      {
        "role": "user",
        "content": "Create a release-risk checklist for a payments API change."
      }
    ],
    "max_tokens": 1200,
    "temperature": 0.3
  }'

للاستجابات الأطول، قم بتمكين البث حتى يتمكن تطبيقك من بدء استقبال الرموز قبل انتهاء الإكمال الكامل:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["NOVITA_API_KEY"],
    base_url="https://api.novita.ai/openai",
)

stream = client.chat.completions.create(
    model="zai-org/glm-5.2",
    messages=[
        {
            "role": "user",
            "content": "Draft a phased plan for refactoring a monolith into services.",
        }
    ],
    max_tokens=2000,
    temperature=0.3,
    stream=True,
)

for chunk in stream:
    delta = chunk.choices[0].delta.content
    if delta:
        print(delta, end="")

احتفظ بمفاتيح API خارج التحكم في المصدر، وقم بتعيين قيم max_tokens صريحة، وسجل بيانات الاستخدام عند توفرها. تسهل نماذج السياق الطويل إرسال مطالبات كبيرة جدًا، لذلك يبدأ التحكم في التكلفة بقياس رموز المطالبة والإكمال من النموذج الأولي.

متى تستخدم GLM 5.2

GLM 5.2 مناسب بقوة عندما تكون مهمتك كبيرة جدًا لسياق الدردشة العادي أو عندما يحتاج النموذج إلى تنسيق خطوات متعددة بالأدوات أو الملفات أو المخرجات المنظمة.

تشمل أهداف التقييم الجيدة:

تحليل المستودع: اطلب من النموذج مراجعة ملاحظات الهندسة المعمارية، خرائط الملفات، أوصاف التبعيات، ومقتطفات التعليمات البرمجية المختارة في طلب واحد.
الوكلاء البرمجيون: احتفظ بأهداف المهمة، القيود، مخططات الأدوات، القرارات السابقة، والملاحظات العملية في السياق بينما يتكرر الوكيل.
توليف المستندات الطويلة: لخص السياسات، المواصفات الفنية، العقود، ملاحظات البحث، أو مستندات المنتج دون تقسيم عدواني.
تخطيط الترحيل: أعط النموذج خريطة النظام، القيود، خطة الطرح، وسجل المخاطر، ثم اسأل عن الثغرات أو مشكلات التسلسل.
الاستخراج المنظم: ادمج مستندات مصدر طويلة مع مخطط JSON صارم للأنظمة النهائية.

GLM 5.2 ليس تلقائيًا النموذج المناسب لكل طلب. للتصنيف القصير، الدردشة الأساسية، الاستخراج البسيط، أو حركة المرور عالية الحجم ومنخفضة زمن الانتقال، قارن النماذج الأصغر في مكتبة نماذج Novita AI والأسعار الحالية على صفحة تسعير Novita AI. نموذج 1M-token يكون أكثر قيمة عندما تحتاج فعلاً إلى السياق أو الحد الأقصى للإخراج أو الميزات الموجهة للوكيل.

استدعاء الدوال والمخرجات المنظمة

يظهر إدراج GLM 5.2 دعم استدعاء الدوال والمخرجات المنظمة. هذه الميزات مفيدة عندما يجب على النموذج إرجاع شيء يمكن لتطبيقك التصرف بناءً عليه، وليس مجرد نثر.

استدعاء الدوال مناسب عندما يعرض تطبيقك أدوات محكومة مثل:

استرداد سجل عميل،
فتح تذكرة،
التحقق من حالة النشر،
البحث في قاعدة معرفة داخلية،
حساب عرض سعر،
أو توجيه طلب إلى خدمة متخصصة.

إليك نمط بسيط لاستدعاء الأداة:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["NOVITA_API_KEY"],
    base_url="https://api.novita.ai/openai",
)

tools = [
    {
        "type": "function",
        "function": {
            "name": "create_release_ticket",
            "description": "Create a release ticket after risk review.",
            "parameters": {
                "type": "object",
                "properties": {
                    "title": {"type": "string"},
                    "risk_level": {
                        "type": "string",
                        "enum": ["low", "medium", "high"],
                    },
                    "summary": {"type": "string"},
                },
                "required": ["title", "risk_level", "summary"],
            },
        },
    }
]

response = client.chat.completions.create(
    model="zai-org/glm-5.2",
    messages=[
        {
            "role": "user",
            "content": "Assess this release and create a ticket if risk is medium or high.",
        }
    ],
    tools=tools,
    tool_choice="auto",
    max_tokens=1000,
)

print(response.choices[0].message)

المخرجات المنظمة مفيدة عندما تريد أن تتناسب الاستجابة مع مخطط يمكن التنبؤ به. حتى عندما تطلب JSON، احتفظ بالتحقق في تطبيقك. تعامل مع مخرجات النموذج كمرشح تم إنشاؤه، قم بتحليله، تحقق من الحقول المطلوبة، وتعامل مع الأخطاء باستخدام مطالبة إصلاح أو مسار احتياطي.

لمزيد من المعلومات حول تصميم الأدوات، راجع دليل Novita AI حول استدعاء الدوال والمخرجات المنظمة والدليل المخصص لـ GLM حول استدعاء الدوال في GLM.

ملاحظات إنتاجية لاستخدام السياق الطويل

نافذة السياق الرئيسية هي السقف وليس وضع التشغيل الافتراضي. طلب 1,048,576 رمزًا يمكن أن يكون مفيدًا، لكن معظم التطبيقات يجب أن تصل إلى هذا الحجم تدريجيًا.

ابدأ بهذه الضوابط:

ميزانية المطالبة: قم بتقسيم التعليمات المستقرة، إدخال المستخدم المتغير، نتائج الاسترجاع، ومخططات الأدوات حتى تتمكن من رؤية الجزء الذي يدفع عدد الرموز.
استخدم الاسترجاع قبل الحشو الكامل: أرسل الملفات أو المقاطع الأكثر صلة أولاً، ثم وسع السياق فقط عندما تحتاج المهمة إلى مزيد من الأدلة.
تحديد طول الإخراج: يدعم GLM 5.2 إخراجًا أقصى عاليًا، لكن معظم سير العمل لا يحتاج إلى 131,072 رمزًا مولّدًا. قم بتعيين max_tokens إلى أصغر قيمة مفيدة.
بث الاستجابات الطويلة: البث يحسن تجربة المستخدم ويسمح لخدمتك بالتعامل مع الإكمالات الطويلة بشكل أكثر سلاسة.
التحقق من النتائج المنظمة: المخططات تقلل الغموض، لكن تطبيقك لا يزال بحاجة إلى فحوصات المحلل اللغوي (parser) وإعادة المحاولات ومعالجة الأخطاء الواضحة.
تتبع فرص التخزين المؤقت: كتل السياق المتكررة يمكن أن تكون مكلفة إذا تم إرسالها كإدخال جديد في كل مرة. حدد المطالبات والسياسات وتعريفات الأدوات القابلة لإعادة الاستخدام مبكرًا.
احتفظ بنموذج أصغر كاحتياطي: تستخدم العديد من أنظمة التوجيه نموذجًا أصغر للحالات السهلة وتحتفظ بنماذج السياق الطويل للمهام التي تحتاج إلى سعتها الكاملة.

بالنسبة للوكلاء البرمجيين، أحد الأنماط العملية هو الاحتفاظ بسياق المشروع الدائم خارج المطالبة، واسترداد فقط الملفات ذات الصلة بالمهمة الحالية، واطلب من GLM 5.2 إنتاج خطة محدودة أو مراجعة تصحيح بدلاً من مقال مفتوح. هذا يحافظ على وضوح التكاليف مع إعطاء النموذج سياقًا كافيًا للتفكير عبر أجزاء النظام المهمة.

الأسئلة الشائعة

هل GLM 5.2 متاح على Novita AI؟

نعم. GLM 5.2 مدرج على Novita AI كنموذج بدون خادم مع معرف API للنموذج zai-org/glm-5.2.

ما هي نافذة السياق لـ GLM 5.2 على Novita AI؟

يظهر الإدراج الحالي لـ Novita AI نافذة سياق 1,048,576 رمزًا لـ GLM 5.2.

ما هو الحد الأقصى للإخراج لـ GLM 5.2؟

يظهر الإدراج الحالي لـ Novita AI حدًا أقصى للإخراج 131,072 رمزًا لـ GLM 5.2. قم بتعيين قيمة max_tokens أصغر ما لم يكن سير عملك يحتاج حقًا إلى استجابة طويلة جدًا.

كم تكلفة GLM 5.2 على Novita AI؟

تسرد صفحة التسعير الحالية GLM 5.2 بسعر $1.40 لكل مليون رمز إدخال، $0.26 لكل مليون رمز إدخال قراءة مخزنة مؤقتًا، و$4.40 لكل مليون رمز إخراج.

هل يدعم GLM 5.2 استدعاء الدوال؟

نعم. يظهر إدراج GLM 5.2 الحالي دعم استدعاء الدوال. استخدمه عندما يجب على النموذج الاختيار من أدوات التطبيق الخاضعة للتحكم بدلاً من إرجاع نص بلغة طبيعية فقط.

هل يدعم GLM 5.2 المخرجات المنظمة؟

نعم. يظهر إدراج GLM 5.2 الحالي دعم المخرجات المنظمة. تحقق من JSON المولدة أو الاستجابات ذات الشكل المخطط في تطبيقك قبل استخدامها في المراحل النهائية.

بدء استخدام واجهة GLM 5.2 API على Novita AI

متطلبات البدء السريع لواجهة GLM 5.2 API

مواصفات GLM 5.2 API والتسعير

كيفية إجراء أول طلب GLM 5.2 API

متى تستخدم GLM 5.2

استدعاء الدوال والمخرجات المنظمة

ملاحظات إنتاجية لاستخدام السياق الطويل

الأسئلة الشائعة

هل GLM 5.2 متاح على Novita AI؟

ما هي نافذة السياق لـ GLM 5.2 على Novita AI؟

ما هو الحد الأقصى للإخراج لـ GLM 5.2؟

كم تكلفة GLM 5.2 على Novita AI؟

هل يدعم GLM 5.2 استدعاء الدوال؟

هل يدعم GLM 5.2 المخرجات المنظمة؟

مقالات مقترحة

Product

RESOURCES

Partners

Company

متطلبات البدء السريع لواجهة GLM 5.2 API

مواصفات GLM 5.2 API والتسعير

كيفية إجراء أول طلب GLM 5.2 API

متى تستخدم GLM 5.2

استدعاء الدوال والمخرجات المنظمة

ملاحظات إنتاجية لاستخدام السياق الطويل

الأسئلة الشائعة

هل GLM 5.2 متاح على Novita AI؟

ما هي نافذة السياق لـ GLM 5.2 على Novita AI؟

ما هو الحد الأقصى للإخراج لـ GLM 5.2؟

كم تكلفة GLM 5.2 على Novita AI؟

هل يدعم GLM 5.2 استدعاء الدوال؟

هل يدعم GLM 5.2 المخرجات المنظمة؟

مقالات مقترحة

مقالات ذات صلة

Product

RESOURCES

Partners

Company