GLM-4.7 auf Novita AI: Langkontext-Agenten-Coding über API

GLM-4.7 auf Novita AI: Langkontext-Agenten-Coding über API

GLM-4.7 ist jetzt auf der Novita AI-Plattform verfügbar und bringt Z.AIs neuestes Flaggschiff-Textmodell auf eine produktionsreife, OpenAI-kompatible serverlose API. GLM-4.7 ist optimiert für agentisches Coding, langfristige Planung und toolgestützte Workflows, mit stärkerer „Denken → Handeln“-Zuverlässigkeit und deutlich verbesserten Frontend-Ästhetik für echte Produktauslieferung.

Auf Novita AI können Sie GLM-4.7 mit 204.800 Token Kontext, bis zu 131.072 Token Ausgabe, fp8-Quantisierung und integrierter Unterstützung für Function Calling und Structured Output ausführen.

Probieren Sie GLM 4.7 jetzt aus!

Was ist GLM-4.7?

GLM-4.7 ist Z.AIs neuestes Flaggschiff-Textmodell mit Hauptupgrades, die auf fortgeschrittenes Coding, langfristige Aufgabenplanung und zuverlässigere Tool-Zusammenarbeit abzielen – es wurde entwickelt, um Aufgaben Ende-zu-Ende zu erledigen, statt nur isolierte Code-Snippets zu generieren.

Technische Daten (offiziell):

  • Kontextfenster: 200K Token
  • Maximale Ausgabe: 128K Token
  • Funktionen: Denkmodi, Streaming, Function Calling, Context Caching, Structured Output (JSON) sowie MCP-Tool-/Datenquellenintegration

💡Was Sie auf Novita AI erhalten (produktionsreife serverlose Umgebung):

Element Details
Modell GLM-4.7
Kontextlänge 204.800
Maximale Ausgabe 131.072
Quantisierung fp8
Function Calling / Structured Output Unterstützt

Probieren Sie GLM 4.7 jetzt aus!

Warum GLM-4.7 auf Novita AI

Transparente serverlose Preisgestaltung (Zahlung pro Token)

Auf Novita AI läuft GLM-4.7 als serverloser Endpunkt mit klarer, tokenbasierter Abrechnung:

  • Eingabe: $0,6 / 1M Token
  • Cache-Lesen: $0,11 / 1M Token
  • Ausgabe: $2,2 / 1M Token

Diese Cache-Lesen-Zeile ist wichtig: Sie ermöglicht kosteneffiziente langfristige Workflows (stellen Sie sich einen „Agenten vor, der über viele Turns hinweg an einem großen Repo/Spezifikation arbeitet“). Klicken Sie hier, um weitere Informationen zur Preisgestaltung zu erhalten.

OpenAI-kompatible API für sofortige Integration

Wenn Sie bereits APIs im Stil von OpenAIs Chat Completions verwenden, können Sie migrieren, indem Sie Novitas Basis-URL festlegen und den Modellnamen wechseln – kein neues Protokoll zum Erlernen erforderlich.

Für agentische Auslieferung entwickelt

Z.AI positioniert GLM-4.7 rund um „Aufgabenerledigung“, mit stärkerer Befolgung von Anweisungen bei der Tool-Nutzung und verbesserter Stabilität für komplexe Agenten-Schleifen.

GLM-4.7 Funktionen & Benchmarks

GLM-4.7 ist ausgelegt auf agentisches Coding (Ende-zu-Ende-Erledigung von Aufgaben), stärkeres Reasoning mit kontrollierbarem Denken und zuverlässigere toolgestützte Workflows – mit einem deutlichen Sprung bei der Web-/UI-Generierungsqualität („Vibe Coding“).

Funktionen

  • Agentisches Coding, Ende-zu-Ende: Besser geeignet für Planung, Implementierung und Iteration über Multi-Datei-Projekte und echte Agenten-Frameworks hinweg.
  • Denken vor dem Handeln (stabilere Agenten): Verbesserte Befolgung von Anweisungen und Stabilität bei komplexen Aufgaben; unterstützt Turn-Level-Steuerung, um Kosten/Latenz vs. Zuverlässigkeit auszugleichen.
  • Tool-Nutzung & Web-Browsing: Stärkere Tool-Ausführungsmuster und browsing-ähnliche Aufgaben.
  • Verbessertes komplexes Reasoning: Messbare Fortschritte bei harten Reasoning-Evaluierungen (einschließlich tool-augmentierter Einstellungen).
  • Vibe Coding (UI & Folienqualität): Sauberere moderne Webseiten und besser aussehende Folien/Layouts.

Standardisierte Benchmarks

Die folgenden Werte werden von Z.AI gemeldet:

Kategorie Benchmark GLM-4.7
Coding (echte Fehlerbehebung) SWE-bench Verified 73,8
Agentisch / Terminal Terminal Bench 2.0 41,0
Coding (Live) LiveCodeBench v6 84,9
Tool-Nutzung (interaktiv) τ²-Bench 87,4
Web-Browsing BrowseComp 52,0 (und 67,5 mit Kontextverwaltung)
Reasoning (Tools) HLE (mit Tools) 42,8

Benchmark-Diagramm mit dem Titel „LLM-Leistungsbewertung: Agentisch, Reasoning und Coding“, das GLM-4.7 mit GLM-4.6, DeepSeek-V3.2, Claude Sonnet 4.5 und GPT-5.1 (High) über acht Benchmarks (AIME 25, LiveCodeBench v6, GPQA-Diamond, HLE, SWE-bench Verified, Terminal Bench 2.0, τ²-Bench, BrowseComp) unter 128K Kontext vergleicht; GLM-4.7 führt bei SWE-bench Verified (73,8), Terminal Bench 2.0 (41,0) und τ²-Bench (87,4) und erreicht 42,8 bei HLE mit Tools.

LMArena „Menschliche Präferenz“-Signal

Die LMArena-Rankings basieren auf blinden Nutzerstimmen und sind eine nützliche „Wie fühlt es sich an?“-Ergänzung zu Benchmarks.

  • WebDev-Rangliste: GLM-4.7 ist auf Platz 6 mit Punktzahl 1447 (+10/-10), 4.833 Stimmen (zuletzt aktualisiert am 16. Januar 2026).
  • Text Arena (Gesamt): GLM-4.7 ist auf Platz 18 mit Punktzahl 1443 (±7), 8.258 Stimmen (zuletzt aktualisiert am 12. Januar 2026).

🏆Open-Model-Positionierung: Auf beiden Ranglisten haben die über GLM-4.7 platzierten Modelle proprietäre Lizenzen, während GLM-4.7 unter MIT-Lizenz steht – wodurch es das am höchsten eingestufte Open-Lizenz-Modell in WebDev und Text (Gesamt) zum Zeitpunkt dieser Ranglistenaktualisierungen ist.

Erste Schritte mit GLM-4.7 auf Novita AI

Option A: Nutzen Sie den Playground

Der einfachste Weg, GLM-4.7 kennenzulernen, ist es, direkt im Novita AI Playground auszuprobieren. Sie können sofort mit GLM-4.7 im Novita AI Playground interagieren – kein Setup, kein Code. Melden Sie sich einfach an, öffnen Sie den Playground und testen Sie Prompts in Echtzeit. Neue Konten erhalten nach der Registrierung kostenlose Guthaben, sodass Sie das Modell sofort ausprobieren können.

Zum Playground!

Option B: Integration über API

Verbinden Sie GLM-4.6V mit Ihren Anwendungen über Novita AIs einheitliche REST-API.

So erhalten Sie Ihren API-Schlüssel auf Novita AI

  • Schritt 1: Erstellen oder Anmelden Ihres Kontos Besuchen Sie [https://novita.ai](https://novita.ai) und registrieren Sie sich oder melden Sie sich bei Ihrem bestehenden Konto an.
  • Schritt 2: Navigieren Sie zur Schlüsselverwaltung Nach der Anmeldung suchen Sie nach „API-Schlüsseln“
  • Schritt 3: Erstellen Sie einen neuen Schlüssel Klicken Sie auf die Schaltfläche „Neuen Schlüssel hinzufügen“.
  • Schritt 4: Speichern Sie Ihren Schlüssel sofort Kopieren und speichern Sie den Schlüssel, sobald er generiert wurde; er wird normalerweise nur einmal angezeigt und kann später nicht abgerufen werden. Bewahren Sie den Schlüssel an einem sicheren Ort wie einem Passwort-Manager oder verschlüsselten Notizen auf.

Direkte API-Integration

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="zai-org/glm-4.7",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=131072,
    temperature=0.7
)

print(response.choices[0].message.content) 

Multi-Agenten-Workflows mit OpenAI Agents SDK

Erstellen Sie anspruchsvolle Agentensysteme mit Plug-and-Play-Integration – unterstützt Übergaben, Routing und Tool-Nutzung über natives Function Calling sowie das volle Langkontext-Fenster für komplexe, mehrstufige Aufgaben.

Option C: Verbindung mit Drittanbieter-Plattformen

Wenn Sie bereits mit Agenten-Frameworks oder Entwicklertools arbeiten, ist Novita AI für die einfache Integration mit minimalem Aufwand ausgelegt:

  • Agenten-Frameworks & App-Builder: Befolgen Sie Novitas Schritt-für-Schritt-Integrationsanleitungen, um sich mit beliebten Tools wie Continue, AnythingLLM, LangChain und Langflow zu verbinden.
  • Hugging Face Hub: Novita ist als Inferenz-Anbieter auf Hugging Face gelistet, sodass Sie unterstützte Modelle über Hugging Faces Anbieter-Workflow und Ökosystem ausführen können.
  • OpenAI-kompatible API: Novitas LLM-Endpunkte sind kompatibel mit dem OpenAI-API-Standard, sodass Sie bestehende OpenAI-ähnliche Apps einfach migrieren und viele OpenAI-kompatible Tools verbinden können ( Cline, Cursor, Trae und Qwen Code) .
  • Anthropic-kompatible API (Claude Code-Workflows): Novita bietet außerdem Anthropic SDK-kompatiblen Zugriff, sodass Sie Novita-unterstützte Modelle in Claude Code-ähnliche agentische Coding-Workflows integrieren können.
  • OpenCode (Integrierter Anbieter): Novita AI ist jetzt direkt als unterstützter Anbieter in OpenCode integriert, sodass Benutzer Novita in OpenCode ohne manuelle Konfiguration auswählen können.

Produktionsmuster

  1. Nutzen Sie Prompt-Cache für langfristige Agenten Wenn Sie Multi-Turn-Workflows mit großem, stabilem Kontext (Repo-Snapshot, lange Spezifikation, Designdokument) ausführen, kann Caching die Kosten deutlich senken – Novita macht die Cache-Lesen-Preisgestaltung explizit zugänglich.

  2. Structured Output für zuverlässige Pipelines Bei der Integration mit Workflow-Engines, Validierern oder UIs bevorzugen Sie JSON-strukturierte Ausgaben (schema-gesteuert), um Parsing-Randfälle zu reduzieren. Novita listet Structured Output als für GLM-4.7 unterstützt auf.

  3. Function Calling für tool-augmentiertes Coding Packen Sie Ihre Tools als Funktionen: Repo-Suche, Ticket-Abfrage, CI-Trigger, Datenbanklese, Web-Fetch – lassen Sie dann das Modell entscheiden, wann es sie aufrufen soll. GLM-4.7 ist explizit für stärkere Tool-Zusammenarbeit ausgelegt.

  4. Denkmodus-Richtlinie: „Standardmäßig schnell, bei Bedarf tief“

    • Triviale Q&A / Formatierung: Denken aus
    • Debugging / mehrstufige Refactorings: Denken an
    • Lange Aufgaben: Erwägen Sie Modi, die Stabilität und Cache-Trefferquote verbessern.

Fazit

GLM-4.7 bietet ein praktisches Set an Upgrades für Entwickler, die agentisches Coding und langfristige toolgestützte Workflows erstellen: 200K Kontext, kontrollierbares Denken, stärkeres Function Calling-Verhalten und bessere Frontend-„Vibe Coding“-Ausgaben.

Auf Novita AI können Sie sofort mit einer OpenAI-kompatiblen serverlosen API starten, mit transparenter tokenbasierter Preisgestaltung und integrierter Unterstützung für Function Calling und Structured Outputs – bereit für produktionsreife Agenten-Pipelines.

Weitere Informationen zu GLM 4.7

Novita AI ist eine KI-Cloud-Plattform, die Entwicklern einen einfachen Weg bietet, KI-Modelle über unsere einfache API bereitzustellen, sowie erschwingliche und zuverlässige GPU-Cloud zum Erstellen und Skalieren bereitstellt.

Häufig gestellte Fragen

Was ist GLM-4.7?

GLM-4.7 ist Z.AIs Flaggschiff-LLM, positioniert für verbessertes Programmieren und stabileres mehrstufiges Reasoning/Ausführung, und wird mit einem offiziellen Open-Weights-Modell veröffentlicht (verfügbar auf Hugging Face).

Ist GLM-4.7 kostenlos?

Auf Novita AI ist GLM-4.7 tokenbasiert abgerechnet: $0,6/M Token (Eingabe), $0,11/M Token (Cache-Lesen) und $2,2/M Token (Ausgabe)
Auf Z.ai ist der Zugriff üblicherweise in einem kostenpflichtigen Coding-Plan paketiert (ab $3/Monat).
Einige Plattformen bieten möglicherweise begrenzte Testversionen/Kontingente wie Novita AI, aber GLM-4.7 selbst ist nicht universell „kostenlos“.

Ist GLM-4.7 wirklich gut?

Für Coding + agentische Workflows wird es von seinem Herausgeber als Top-Open-Modell positioniert. Z.AI meldet starke Ergebnisse bei Coding- und Agenten-Benchmarks (z. B. LiveCodeBench v6, SWE-bench Verified, BrowseComp, τ²-Bench) und positioniert es als wettbewerbsfähig mit Claude Sonnet 4.5 bei mehreren Messungen.