GLM-5.1 auf Novita AI: Startanleitung und Preise

GLM-5.1 auf Novita AI: Startanleitung und Preise

GLM-5.1 ist auf Novita AI als serverloses Text-LLM mit OpenAI-kompatiblem Chat-Completion-Zugriff verfügbar. Die Modell-ID lautet zai-org/glm-5.1; das angegebene Kontextfenster beträgt 204.800 Token; und die Preise betrugen bei Überprüfung am 12. Juni 2026 1,38 $ pro Million Eingabe-Token und 4,4 $ pro Million Ausgabe-Token.

Diese Anleitung zeigt die genaue Modell-ID, den Endpunkt, die Preisfelder und eine erste Anfrage, die Sie in eine Testumgebung kopieren können.

Die wichtigsten Erkenntnisse

  • Novita AI listet GLM-5.1 als serverloses Chat-Modell mit Texteingabe und Textausgabe.
  • Verwenden Sie zai-org/glm-5.1 für OpenAI-kompatible Chat-Completion-Anfragen.
  • Die Modellseite listet ein Kontextfenster von 204.800 Token, maximal 131.072 Ausgabe-Token, 1,38 $/Mio. Eingabe-Token, 4,4 $/Mio. Ausgabe-Token und 0,26 $/Mio. Cache-Lese-Eingabe-Token.
  • Beginnen Sie mit Tests an Eingabeaufforderungen, die tatsächlich einen langen Kontext benötigen, wie z. B. Code-Review-Pakete, Migrationspläne oder Agentenaufgabenverläufe.

Was ist GLM-5.1?

GLM-5.1 ist ein Textmodell der Z.AI GLM-Familie, das auf Novita AI für langfristige Aufgaben, Entwicklungsarbeit und Anwendungsfälle als Codierungsassistent gelistet ist. Die Modellseite beschreibt es als Modell für nachhaltige Ausführung, Planung, iterative Optimierung und produktionsreife Aufgabenausführung.

Für die Integration sind die wichtigsten Details die Modell-ID, der Endpunktpfad, die Kontext- und Ausgabelimits sowie die Preise für lange Eingabeaufforderungen oder lange Antworten. Auf Novita AI sind diese Details an die Modelleintragung zai-org/glm-5.1 und die LLM-API-Dokumentation gebunden.

GLM-5.1 unterscheidet sich vom älteren GLM-5-Eintrag im Novita AI-Katalog. GLM-5.1 hat eine eigene Modell-ID, eine eigene Modell-Detailseite, eigene Preise und eine eigene Kontextgröße. Wenn Ihre bestehende Integration zai-org/glm-5 verwendet, tauschen Sie die Modell-IDs nicht stillschweigend aus. Führen Sie eine kleine Evaluierung mit repräsentativen Eingabeaufforderungen, dem erwarteten Ausgabeformat und der Token-Kostenprotokollierung durch, bevor Sie den Produktionsverkehr umstellen.

GLM-5.1 API-Zugriff auf Novita AI

Starten Sie auf der GLM-5.1-Modellseite auf Novita AI, um die aktuelle Modelleintragung, Preise, Kontextgröße, Funktionen und Endpunktoptionen vor der Einführung zu bestätigen. Das Modell wird als Chat-Modell mit serverlosem Zugriff, Texteingabe und Textausgabe gelistet.

Verwenden Sie für OpenAI-kompatiblen Client-Code die Novita AI Chat Completion API-Dokumentation. Der Anforderungspfad lautet:

POST https://api.novita.ai/openai/v1/chat/completions

Wenn Sie das OpenAI Python SDK verwenden, konfigurieren Sie den Client mit:

https://api.novita.ai/openai

Rufen Sie dann client.chat.completions.create(...) mit model="zai-org/glm-5.1" auf.

Der Modelleintrag listet auch eine Anthropic-Endpunktoption. Diese Anleitung konzentriert sich auf den OpenAI-kompatiblen Chat-Completion-Pfad, da er der direkteste Ausgangspunkt für Teams ist, die vorhandenen OpenAI SDK-Code anpassen.

GLM-5.1 Spezifikationen und Preisübersicht

Die folgenden Werte wurden am 12. Juni 2026 anhand der aktuellen Novita-Modellseite und API-Dokumente überprüft.

Feld Details
Anzeigename GLM-5.1
Modell-ID zai-org/glm-5.1
Modelltyp Chat
Zugriffsmodus Serverlos
Eingabe-/Ausgabemodalität Texteingabe / Textausgabe
OpenAI-kompatible Basis-URL https://api.novita.ai/openai
Chat-Endpunkt POST /v1/chat/completions
Gelistete Endpunkte chat/completions, anthropic
Kontextfenster 204.800 Token
Maximale Ausgabe-Token 131.072 Token
Eingabepreis 1,38 $/Mio. Token
Ausgabepreis 4,4 $/Mio. Token
Cache-Lese-Eingabepreis 0,26 $/Mio. Token
Gelistete Funktionskennzeichnungen Funktionsaufrufe, strukturierte Ausgaben, Reasoning, serverlos

Preise und Limits können sich ändern. Bevor Sie Kosten schätzen oder Produktionsverkehr leiten, überprüfen Sie die aktuelle GLM-5.1-Modellseite erneut und verwenden Sie die neuesten Werte in Ihrem eigenen Rechner.

Wann Sie GLM-5.1 verwenden sollten

Verwenden Sie GLM-5.1, wenn die Anfrage textbasiert ist und das Modell genügend Kontext benötigt, um über viele Dateien, Protokolle, Anforderungen oder vorherige Nachrichten hinweg zu argumentieren. Typische Tests umfassen Code-Review-Pakete, Migrationspläne, Repository-Zusammenfassungen, Dokumentsynthese und Agentenaufgabenverläufe.

Das aufgeführte Kontextfenster von 204.800 Token und die maximale Ausgabe von 131.072 Token bieten Platz für Problemverlauf, Quellcodeauszüge, Protokolle, Testausgaben, Architekturnotizen und ein Antwortschema. Nutzen Sie diesen Platz für Material, von dem die Antwort abhängt, nicht als Ablage für jede Datei.

Halten Sie bei Produktionstests die Eingabeaufforderung organisiert: trennen Sie Anforderungen von Quellcodeauszügen, beschriften Sie Protokolle und Dateien klar und erfassen Sie die Anzahl der Eingabe- und Ausgabe-Token. Das erleichtert den Kosten- und Qualitätsvergleich über verschiedene Modellläufe hinweg.

Wann Sie GLM-5.1 nicht verwenden sollten

Für kurze Klassifikation, einfache Extraktion, Routing oder einzeiliges Umschreiben beginnen Sie mit einem kleineren Modell, es sei denn, Ihre eigenen Tests zeigen einen deutlichen Qualitätsgewinn durch GLM-5.1. Diese Aufgaben benötigen in der Regel kein langes Kontextfenster.

GLM-5.1 wird auf Novita AI als Texteingabe-/Textausgabe-Modell gelistet. Wenn Ihre Anwendung Bildverständnis, Sprache, Bilderzeugung oder Videoerzeugung benötigt, wählen Sie eine Modellseite und API-Familie, die diese Modalität explizit unterstützt.

Wenn Sie GLM-5.1 zwischen Anbietern vergleichen, überprüfen Sie die Novita AI-Modellseite, bevor Sie Einstellungen aus einer anderen Quelle kopieren. Die Modell-ID, der Endpunktpfad, die Kontextlimits und die Preise in Ihrer Novita AI-Integration sollten der Novita AI-Listung und den API-Dokumenten entsprechen.

Schritt 1: Holen Sie sich Ihren Novita-API-Schlüssel

Erstellen oder öffnen Sie Ihr Novita AI-Konto und generieren Sie dann einen API-Schlüssel aus der Novita AI-Konsole. Speichern Sie ihn in einer Umgebungsvariable anstatt ihn fest in Quelldateien zu codieren:

export NOVITA_API_KEY="your_api_key_here"

Für Produktions-Apps bewahren Sie den API-Schlüssel in Ihrem Secret Manager, CI-Secret-Store oder den verschlüsselten Umgebungseinstellungen Ihrer Bereitstellungsplattform auf. Committen Sie den Schlüssel nicht in ein Repository und fügen Sie ihn nicht in clientseitigen Browser-Code ein.

Schritt 2: Bestätigen Sie Modell-ID und Endpunkt

Verwenden Sie diese Modell-ID:

zai-org/glm-5.1

Verwenden Sie diese OpenAI-kompatible Basis-URL in SDK-Clients:

https://api.novita.ai/openai

Verwenden Sie diesen vollständigen Endpunktpfad für direkte HTTP-Anfragen:

https://api.novita.ai/openai/v1/chat/completions

Führen Sie vor einer Produktionseinführung eine letzte Überprüfung gegen den Novita AI-Modelllisten-Endpunkt oder die GLM-5.1-Modellseite durch. Diese Überprüfung bestätigt, dass die Modell-ID weiterhin verfügbar ist und dass die Modellmetadaten noch mit Ihrem Code und Ihren Preisnotizen übereinstimmen.

Schritt 3: Senden Sie Ihre erste GLM-5.1-Anfrage

Hier ist ein minimales Python-Beispiel im OpenAI SDK-Stil:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["NOVITA_API_KEY"],
    base_url="https://api.novita.ai/openai",
)

response = client.chat.completions.create(
    model="zai-org/glm-5.1",
    messages=[
        {
            "role": "system",
            "content": "You review backend migration plans. Return a checklist with risks, test coverage, and rollback steps.",
        },
        {
            "role": "user",
            "content": "Create a migration checklist for moving a Python service from sync workers to async workers.",
        },
    ],
    max_tokens=1200,
    temperature=0.2,
)

print(response.choices[0].message.content)

Und hier die gleiche erste Anfrage mit cURL:

curl "https://api.novita.ai/openai/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer ${NOVITA_API_KEY}" \
  -d '{
    "model": "zai-org/glm-5.1",
    "messages": [
      {
        "role": "system",
        "content": "You review backend migration plans. Return a checklist with risks, test coverage, and rollback steps."
      },
      {
        "role": "user",
        "content": "Create a migration checklist for moving a Python service from sync workers to async workers."
      }
    ],
    "max_tokens": 1200,
    "temperature": 0.2
  }'

Diese Beispiele verwenden die üblichen Chat-Completion-Felder, die in der Novita AI LLM API-Dokumentation behandelt werden: model, messages, max_tokens und temperature.

Schritt 4: Lesen der Antwort

Für die Standard-Chat-Completion-Antwort lesen Sie die Assistenten-Nachricht aus:

response.choices[0].message.content

Protokollieren Sie die Token-Nutzung, wenn sie in der Client-Antwort verfügbar ist. Nutzungsdaten helfen Ihnen, Prompt-Designs zu vergleichen, Kosten zu schätzen und Anfragen zu identifizieren, die für die Aufgabe zu breit gefasst sind.

Halten Sie das erste Antwortformat einfach. Sobald die grundlegende Anfrage funktioniert, fügen Sie Ihr eigenes Antwortschema, Routing-Logik, Wiederholungen und Bewertungsprüfungen hinzu. Die Modellseite listet strukturierte Ausgaben und Funktionsaufrufe unter den unterstützten Funktionskennzeichnungen, aber überprüfen Sie jeden erweiterten Parameter in Ihrer eigenen Integration, bevor Sie ihn zu einem Teil eines Produktionsvertrags machen.

Schritt 5: Überprüfen von Preisen, Limits und häufigen Fehlern

Die Preisgestaltung von GLM-5.1 ist tokenbasiert. Nach Überprüfung am 12. Juni 2026 listet die Novita AI-Modellseite 1,38 $ pro Million Eingabe-Token, 4,4 $ pro Million Ausgabe-Token und 0,26 $ pro Million Cache-Lese-Eingabe-Token. Die Kosten steigen schnell, wenn Aufforderungen irrelevanten Kontext enthalten oder Ausgaben unbegrenzt bleiben.

Häufige Probleme, die während der Integration zu prüfen sind:

  • Authentifizierungsfehler: Bestätigen Sie, dass NOVITA_API_KEY gesetzt und als Authorization: Bearer ${NOVITA_API_KEY} gesendet wird.
  • Modell nicht gefunden: Bestätigen Sie, dass die genaue Modell-ID zai-org/glm-5.1 ist.
  • Falsche Basis-URL: SDK-Clients sollten https://api.novita.ai/openai verwenden, während direkte HTTP-Anfragen https://api.novita.ai/openai/v1/chat/completions aufrufen sollten.
  • Kontext zu groß: Reduzieren Sie abgerufene Dokumente, Protokolle oder Quelldateien, bevor Sie es erneut versuchen.
  • Ausgabe zu lang: Setzen Sie einen praktischen max_tokens-Wert für die Aufgabe und fordern Sie ein begrenztes Antwortformat.
  • Automatisierungsdrift: Bewerten Sie an echten Aufgaben, fügen Sie nach Möglichkeit deterministische Validatoren hinzu und verlangen Sie eine menschliche Überprüfung für Änderungen mit hoher Auswirkung.

Abschließende Empfehlung

Verwenden Sie GLM-5.1 auf Novita AI, wenn Ihr Testfall von langem Textkontext abhängt und Sie einen OpenAI-kompatiblen Chat-Completion-Pfad wünschen. Beginnen Sie mit einem kleinen Evaluierungsset, rufen Sie zai-org/glm-5.1 auf, protokollieren Sie die Token-Nutzung und vergleichen Sie die Antworten mit dem Modell, das Sie bereits verwenden.

Für kurze Aufforderungen, einfache Extraktion oder nicht-textbasierte Arbeitslasten wählen Sie zuerst ein kleineres oder modalitiespezifisches Modell. GLM-5.1 ist am sinnvollsten, wenn die Aufgabe von einem größeren Kontextfenster oder einem größeren Ausgabebudget abhängt.

FAQ

Ist GLM-5.1 auf Novita AI verfügbar?

Ja. Nach Überprüfung am 12. Juni 2026 ist GLM-5.1 in der Novita AI-Modellbibliothek als serverloses Chat-Modell gelistet.

Welche Modell-ID sollte ich für GLM-5.1 verwenden?

Verwenden Sie zai-org/glm-5.1.

Welchen Endpunkt sollte ich aufrufen?

Rufen Sie für OpenAI-kompatible Chat-Completions POST https://api.novita.ai/openai/v1/chat/completions auf. Setzen Sie in OpenAI SDK-Clients die Basis-URL auf https://api.novita.ai/openai.

Wie viel kostet GLM-5.1 auf Novita AI?

Nach Überprüfung am 12. Juni 2026 listet Novita AI GLM-5.1 mit 1,38 $ pro Million Eingabe-Token und 4,4 $ pro Million Ausgabe-Token. Die Modellseite listet auch den Cache-Lese-Eingabepreis mit 0,26 $ pro Million Token.

Was sind die Kontext- und Ausgabelimits von GLM-5.1?

Die Novita AI-Modellseite listet ein Kontextfenster von 204.800 Token und maximal 131.072 Ausgabe-Token für GLM-5.1.

Unterstützt GLM-5.1 Funktionsaufrufe oder strukturierte Ausgaben?

Die Novita AI-Modellseite listet Funktionsaufrufe und strukturierte Ausgaben unter den Funktionskennzeichnungen von GLM-5.1. Überprüfen Sie die genauen Anfragefelder in Ihrer eigenen Integration, bevor Sie sich in Produktion auf erweitertes Verhalten verlassen.

Wie unterscheidet sich GLM-5.1 von GLM-5 auf Novita AI?

GLM-5.1 und GLM-5 sind separate Novita AI-Modelleinträge mit unterschiedlichen Modell-IDs, Preisen, Kontextwerten und Katalogstatus. Verwenden Sie zai-org/glm-5.1 für GLM-5.1 und zai-org/glm-5 für GLM-5.