بداية سريعة لواجهة GLM 5.2 API على Novita AI

بداية سريعة لواجهة GLM 5.2 API على Novita AI

يشرح هذا الدليل السريع كيفية استدعاء نموذج GLM 5.2 على Novita AI من خلال واجهة برمجة تطبيقات الدردشة المتوافقة مع OpenAI. استخدم معرف النموذج المُتحقق منه zai-org/glm-5.2، وعنوان URL الأساسي لـ Novita AI، وطلبًا أوليًا صغيرًا قبل اختبار نافذة السياق البالغة 1,048,576 رمزًا، والإخراج الأقصى البالغ 131,072 رمزًا، واستدعاء الوظائف، والمخرجات المنظمة، ودعم التفكير، أو الوصول المتوافق مع Anthropic كما هو موضح في قائمة النموذج الحالية.

المتطلبات الأساسية لبدء استخدام GLM 5.2 API

GLM 5.2 هو النموذج الرئيسي من Z.AI للعمل المستقل طويل المدى. تصف صفحة نموذج Novita AI أنه نموذج مصمم للمهام المستدامة مثل التخطيط والتنفيذ والتحسين التكراري والبرمجة وتقديم نتائج على مستوى الإنتاج. بالنسبة للمطورين، النقطة العملية بسيطة: GLM 5.2 ليس مجرد نموذج دردشة قصير آخر. إنه موجَّه لسير العمل حيث يحتاج النموذج إلى سياق كافٍ للاحتفاظ بمهمة كبيرة، أو قاعدة بيانات برمجية، أو مجموعة مستندات، أو حالة وكيل في الأفق.

على Novita AI، يتم عرض GLM 5.2 من خلال واجهات برمجة تطبيقات النماذج غير الخادمة. هذا مهم إذا كنت تريد تقييم النموذج دون إنشاء بنية تحتية لوحدة معالجة الرسومات (GPU)، أو توجيه حركة المرور عبر مكدس استدلال مخصص، أو إدارة خدمة السياق الطويل بنفسك. تستخدم مفتاح API الخاص بـ Novita AI، ونقطة النهاية المتوافقة مع OpenAI، ومعرف النموذج الدقيق:

zai-org/glm-5.2

يشرح دليل واجهة LLM API الحالي لـ Novita AI نهج المنصة المتوافق مع OpenAI لمهام الدردشة والإكمال. يوثق مرجع واجهة برمجة تطبيقات إكمال الدردشة مسار REST المستخدم في الأمثلة أدناه:

https://api.novita.ai/openai/v1/chat/completions

استخدم صفحة النموذج للحصول على تفاصيل خاصة بالنموذج مثل طول السياق، والحد الأقصى للإخراج، والتسعير، والطرق، وعائلات نقاط النهاية المدعومة. استخدم مرجع API لمعلمات الطلب، والمصادقة، والتدفق، وهيكل رسالة الدردشة.

مواصفات GLM 5.2 API والتسعير

يُظهر إدراج Novita AI الحالي لـ GLM 5.2 نموذجًا نصيًا غير خادم (Serverless) مع دعم السياق الطويل والميزات الموجهة للوكيل.

الحقل القيمة الحالية في Novita AI
الاسم المعروض GLM 5.2
معرف نموذج API zai-org/glm-5.2
مسار الوصول غير خادم (Serverless)
نافذة السياق 1,048,576 رمزًا
أقصى إخراج 131,072 رمزًا
طرق الإدخال نص
طرق الإخراج نص
عائلات نقاط النهاية chat/completions، نقطة نهاية متوافقة مع Anthropic
استدعاء الوظائف مدعوم
المخرجات المنظمة مدعومة
التفكير مدعوم
سعر الإدخال 1.40 دولار لكل مليون رمز
سعر الإدخال المخزن مؤقتًا للقراءة 0.26 دولار لكل مليون رمز
سعر الإخراج 4.40 دولار لكل مليون رمز

التسعير مُدرَج لكل مليون رمز. للحصول على تقدير سريع، اضرب رموز المطالبة (prompt) في معدل الإدخال والرموز المُنشأة في معدل الإخراج. يمكن للتسعير المخزن مؤقتًا للقراءة أن يقلل التكلفة عندما يرسل تطبيقك نفس السياق القابل لإعادة الاستخدام بشكل متكرر، مثل رسالة النظام، أو مخطط الأداة، أو كتلة السياسة، أو ملخص المستودع الثابت.

على سبيل المثال، طلب يحتوي على 100,000 رمز إدخال غير مخزن مؤقتًا و 5,000 رمز إخراج سيكون تقديره كالتالي:

المكوّن الحساب التكلفة التقديرية
الإدخال 0.1 مليون رمز × 1.40 دولار 0.14 دولار
الإخراج 0.005 مليون رمز × 4.40 دولار 0.022 دولار
الإجمالي الإدخال + الإخراج 0.162 دولار

هذا مجرد تقدير بسيط لمعدل الرموز. تعتمد التكلفة الإنتاجية أيضًا على إعادة استخدام المطالبة، وإعادة المحاولات، والاقتطاع، وسلوك التدفق، وطول الاستجابة، وما إذا كان تطبيقك يتضمن بشكل متكرر كتل سياق كبيرة يمكن تخزينها مؤقتًا أو تلخيصها.

كيفية تقديم أول طلب GLM 5.2 API

ابدأ بمطالبة صغيرة قبل اختبار نافذة السياق الكاملة البالغة 1 مليون رمز. سيمنحك هذا خط أساس نظيف للمصادقة، وتوجيه النموذج، وشكل الاستجابة، وزمن الاستجابة.

قم بتثبيت OpenAI Python SDK وتخزين مفتاح Novita AI الخاص بك في متغير بيئة:

pip install openai
export NOVITA_API_KEY="مفتاح_Novita_AI_الخاص_بك"

ثم اتصل بـ GLM 5.2 باستخدام عنوان URL الأساسي لـ Novita AI:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["NOVITA_API_KEY"],
    base_url="https://api.novita.ai/openai",
)

response = client.chat.completions.create(
    model="zai-org/glm-5.2",
    messages=[
        {
            "role": "system",
            "content": "أنت مساعد عملي في هندسة البرمجيات.",
        },
        {
            "role": "user",
            "content": "راجع خطة الترحيل هذه واذكر الخطوات الأكثر خطورة.",
        },
    ],
    max_tokens=1200,
    temperature=0.3,
)

print(response.choices[0].message.content)

إذا كنت تفضل استدعاء REST مباشر، استخدم مسار إكمال الدردشة:

curl --request POST \
  --url https://api.novita.ai/openai/v1/chat/completions \
  --header "Authorization: Bearer $NOVITA_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "zai-org/glm-5.2",
    "messages": [
      {
        "role": "system",
        "content": "أنت مراجع هندسي موجز."
      },
      {
        "role": "user",
        "content": "أنشئ قائمة مراجعة لمخاطر الإصدار لتغيير في واجهة برمجة تطبيقات الدفع."
      }
    ],
    "max_tokens": 1200,
    "temperature": 0.3
  }'

للحصول على ردود أطول، فعّل التدفق (streaming) حتى يتمكن تطبيقك من بدء استقبال الرموز قبل اكتمال الإكمال الكامل:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["NOVITA_API_KEY"],
    base_url="https://api.novita.ai/openai",
)

stream = client.chat.completions.create(
    model="zai-org/glm-5.2",
    messages=[
        {
            "role": "user",
            "content": "اكتب خطة مرحلية لإعادة هيكلة تطبيق متجانس (monolith) إلى خدمات.",
        }
    ],
    max_tokens=2000,
    temperature=0.3,
    stream=True,
)

for chunk in stream:
    delta = chunk.choices[0].delta.content
    if delta:
        print(delta, end="")

احتفظ بمفاتيح API خارج التحكم بالمصدر، وحدد قيم max_tokens صريحة، وسجل بيانات الاستخدام عندما تكون متاحة. تسهّل نماذج السياق الطويل إرسال مطالبات كبيرة جدًا، لذا يبدأ التحكم في التكاليف بقياس رموز المطالبة والإكمال من النموذج الأولي الأول.

متى تستخدم GLM 5.2

GLM 5.2 مناسب جدًا عندما تكون مهمتك كبيرة جدًا بالنسبة لسياق الدردشة العادي أو عندما يحتاج النموذج إلى تنسيق خطوات متعددة باستخدام الأدوات أو الملفات أو المخرجات المنظمة.

تشمل أهداف التقييم الجيدة:

  • تحليل المستودع: اطلب من النموذج مراجعة ملاحظات الهندسة المعمارية، وخرائط الملفات، وأوصاف التبعيات، ومقتطفات التعليمات البرمجية المختارة في طلب واحد.
  • وكلاء البرمجة: احتفظ بأهداف المهمة، والقيود، ومخططات الأدوات، والقرارات السابقة، والملاحظات العملية في السياق بينما يكرر الوكيل.
  • تجميع المستندات الطويلة: لخص السياسات، والمواصفات الفنية، والعقود، وملاحظات البحث، أو مستندات المنتج دون تجزئة مكثفة.
  • تخطيط الترحيل: أعط النموذج خريطة النظام، والقيود، وخطة الطرح، وسجل المخاطر، ثم اطلب الثغرات أو مشكلات التسلسل.
  • الاستخراج المنظم: ادمج المستندات المصدر الطويلة مع مخطط JSON صارم للأنظمة النهائية.

GLM 5.2 ليس تلقائيًا النموذج المناسب لكل طلب. للتصنيف القصير، والدردشة الأساسية، والاستخراج البسيط، أو حركة المرور عالية الحجم ومنخفضة زمن الاستجابة، قارن النماذج الأصغر في مكتبة نماذج Novita AI والأسعار الحالية في صفحة تسعير Novita AI. يكون نموذج 1 مليون رمز أكثر فائدة عندما تحتاج بالفعل إلى السياق، أو سقف الإخراج، أو الميزات الموجهة للوكيل.

استدعاء الوظائف والمخرجات المنظمة

يظهر إدراج GLM 5.2 دعم استدعاء الوظائف والمخرجات المنظمة. هذه الميزات مفيدة عندما يجب أن يعيد النموذج شيئًا يمكن لتطبيقك التصرف بناءً عليه، وليس مجرد نثر.

استدعاء الوظائف مناسب عندما يعرض تطبيقك أدوات محكومة مثل:

  • استرجاع سجل عميل،
  • فتح تذكرة،
  • التحقق من حالة النشر،
  • البحث في قاعدة معرفة داخلية،
  • حساب عرض سعر،
  • أو توجيه طلب إلى خدمة متخصصة.

إليك نمط استدعاء أدوات بسيط:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["NOVITA_API_KEY"],
    base_url="https://api.novita.ai/openai",
)

tools = [
    {
        "type": "function",
        "function": {
            "name": "create_release_ticket",
            "description": "إنشاء تذكرة إصدار بعد مراجعة المخاطر.",
            "parameters": {
                "type": "object",
                "properties": {
                    "title": {"type": "string"},
                    "risk_level": {
                        "type": "string",
                        "enum": ["منخفض", "متوسط", "عالي"],
                    },
                    "summary": {"type": "string"},
                },
                "required": ["title", "risk_level", "summary"],
            },
        },
    }
]

response = client.chat.completions.create(
    model="zai-org/glm-5.2",
    messages=[
        {
            "role": "user",
            "content": "قيّم هذا الإصدار وأنشئ تذكرة إذا كان مستوى المخاطرة متوسطًا أو عاليًا.",
        }
    ],
    tools=tools,
    tool_choice="auto",
    max_tokens=1000,
)

print(response.choices[0].message)

المخرجات المنظمة مفيدة عندما تريد أن يتوافق الرد مع مخطط قابل للتنبؤ. حتى عندما تطلب JSON، احتفظ بالتحقق في تطبيقك. تعامل مع إخراج النموذج كمرشح مُنشأ، وقم بتحليله، وتحقق من الحقول المطلوبة، وتعامل مع الأخطاء باستخدام مطالبة إصلاح أو مسار بديل.

لمزيد من الخلفية حول تصميم الأدوات، راجع دليل Novita AI حول استدعاء الوظائف والمخرجات المنظمة والدليل المركز على GLM حول استدعاء وظائف GLM.

ملاحظات إنتاجية لاستخدام السياق الطويل

نافذة السياق الرئيسية هي السقف، وليس وضع التشغيل الافتراضي. يمكن أن يكون الطلب الذي يبلغ 1,048,576 رمزًا مفيدًا، لكن معظم التطبيقات يجب أن تكسب طريقها إلى هذا الحجم.

ابدأ بهذه الضوابط:

  • حدد ميزانية المطالبة: افصل التعليمات الثابتة، وإدخال المستخدم المتغير، ونتائج الاسترجاع، ومخططات الأدوات حتى تتمكن من رؤية أي جزء يدفع عدد الرموز.
  • استخدم الاسترجاع قبل الحشو الكامل: أرسل الملفات أو المقاطع الأكثر صلة أولاً، ثم وسّع السياق فقط عندما تحتاج المهمة إلى المزيد من الأدلة.
  • حدد طول الإخراج: يدعم GLM 5.2 إخراجًا أقصى عاليًا، لكن معظم سير العمل لا يحتاج إلى 131,072 رمزًا مولّدًا. اضبط max_tokens على أصغر قيمة مفيدة.
  • دفّق الردود الطويلة: يحسّن التدفق تجربة المستخدم ويساعد خدمتك على التعامل مع الإكمالات الطويلة بشكل أكثر سلاسة.
  • تحقق من النتائج المنظمة: تقلل المخططات من الغموض، لكن تطبيقك لا يزال بحاجة إلى فحوصات المحلل اللغوي، وإعادة المحاولات، ومعالجة الأخطاء الواضحة.
  • تتبع فرص التخزين المؤقت: يمكن أن تكون كتل السياق المتكررة باهظة الثمن إذا تم إرسالها كمدخلات جديدة في كل مرة. حدد المطالبات والسياسات وتعريفات الأدوات القابلة لإعادة الاستخدام مبكرًا.
  • احتفظ بنموذج أصغر كخطة بديلة: تستخدم العديد من أنظمة التوجيه نموذجًا أصغر للحالات السهلة وتحتفظ بنماذج السياق الطويل للمهام التي تحتاج إلى سعتها الكاملة.

بالنسبة لوكلاء البرمجة، هناك نمط عملي يتمثل في الاحتفاظ بسياق المشروع الدائم خارج المطالبة، واسترجاع الملفات ذات الصلة فقط بالمهمة الحالية، واطلب من GLM 5.2 إنتاج خطة محدودة أو مراجعة تصحيح بدلاً من مقال مفتوح. هذا يبقي التكاليف واضحة مع الاستمرار في إعطاء النموذج سياقًا كافيًا للتفكير عبر أجزاء النظام المهمة.

الأسئلة الشائعة

هل GLM 5.2 متاح على Novita AI؟

نعم. تم إدراج GLM 5.2 على Novita AI كنموذج غير خادم (Serverless) مع معرف نموذج API zai-org/glm-5.2.

ما هي نافذة السياق لـ GLM 5.2 على Novita AI؟

يُظهر إدراج Novita AI الحالي نافذة سياق تبلغ 1,048,576 رمزًا لـ GLM 5.2.

ما هو الحد الأقصى للإخراج لـ GLM 5.2؟

يُظهر إدراج Novita AI الحالي حدًا أقصى للإخراج يبلغ 131,072 رمزًا لـ GLM 5.2. اضبط قيمة max_tokens أقل ما لم يكن سير عملك يحتاج حقًا إلى رد طويل جدًا.

كم تكلفة GLM 5.2 على Novita AI؟

تسرد صفحة التسعير الحالية GLM 5.2 بسعر 1.40 دولار لكل مليون رمز إدخال، و 0.26 دولار لكل مليون رمز إدخال مخزن مؤقتًا للقراءة، و 4.40 دولار لكل مليون رمز إخراج.

هل يدعم GLM 5.2 استدعاء الوظائف؟

نعم. يُظهر إدراج GLM 5.2 الحالي دعم استدعاء الوظائف. استخدمه عندما يجب أن يختار النموذج من أدوات التطبيق الخاضعة للتحكم بدلاً من إرجاع نص بلغة طبيعية فقط.

هل يدعم GLM 5.2 المخرجات المنظمة؟

نعم. يُظهر إدراج GLM 5.2 الحالي دعم المخرجات المنظمة. تحقق من صحة JSON المُنشأ أو الردود ذات الشكل المخطط في تطبيقك قبل استخدامها في المراحل النهائية.

مقالات موصى بها