GLM-4.6 ist jetzt verfügbar auf der Novita AI Plattform, die das Flaggschiffmodell der neuen Generation von Zai-org mit erheblichen Verbesserungen bei Kontextlänge, Codierungsleistung und Agentenfähigkeiten bringt. Mit einer 355B-Parameter-MoE-Architektur (Mixture of Experts) und der modernsten Leistung unter Open-Source-Modellen stellt GLM-4.6 einen bedeutenden Fortschritt in den KI-Fähigkeiten dar.
Diese neueste Version verdoppelt das Kontextfenster von 128 auf 200 Token und erreicht bei realen Programmieraufgaben eine nahezu gleichwertige Leistung wie Claude Sonnet 4. Ob Sie KI-Agenten erstellen, komplexe Anwendungen entwickeln oder Automatisierungslösungen erstellen, GLM-4.6 bietet Ihnen die Funktionen, die Sie benötigen. Novita AI's entwicklerfreundliche Infrastruktur.
Aktuelle Preise auf Novita AI: 204,800 Kontext, 0.6 $/1 Mio. Eingabetoken, 2.2 $/1 Mio. Ausgabetoken
Was ist GLM-4.6?
GLM-4.6 ist das Flaggschiffmodell der neuen Generation von Zhipu AI, das gegenüber GLM-4.5 erhebliche Verbesserungen bietet und die höchste Leistung unter den Open-Source-Modellen erreicht. Es basiert auf einer 355B-Parameter-MoE-Architektur und ist speziell für agentenbasierte Aufgaben, Codierungsanwendungen und komplexe Schlussfolgerungsszenarien konzipiert.
Erweitertes Kontextfenster: GLM-4.6 führt ein 200K-Token-Kontextfenster ein (gegenüber 128K in GLM-4.5), wodurch komplexere Konversationen und größere Codebasen verarbeitet werden können. Diese Erweiterung ermöglicht Entwicklern die Arbeit mit umfangreicher Dokumentation, die Analyse längerer Codedateien und die Aufrechterhaltung des Kontexts in komplexen Agent-Workflows.
Überlegene Codierungsleistung: GLM-4.6 zeigt erhebliche Verbesserungen in mehreren Benchmarks und eine außergewöhnliche Leistung in der Praxis mit beliebten Programmierassistenten wie Claude Code, Cline, Roo Code und Kilo Code. Das Modell zeichnet sich durch die Generierung optisch ansprechender Front-End-Seiten und die präzisere Bearbeitung komplexer Entwicklungsaufgaben aus.
Verbesserte Denkfähigkeiten: Die Argumentation des Modells wurde durch die Unterstützung der Tool-Nutzung während der Inferenz gestärkt, was zu einer besseren Leistung in Problemlösungsszenarien führt. GLM-4.6 lässt sich effektiver in Agenten-Frameworks integrieren und eignet sich daher ideal für den Aufbau KI-gestützter Automatisierungssysteme, die mehrstufiges Denken und die Integration externer Tools erfordern.
Verfeinerte Schreibqualität: GLM-4.6 erstellt Texte, die hinsichtlich Stil und Lesbarkeit besser den menschlichen Vorlieben entsprechen und in Rollenspielszenarien und bei Aufgaben zur Inhaltserstellung natürlicher wirken.
Leistungsbenchmarks
GLM-4.6 zeigt eine starke Leistung bei umfassenden Bewertungen, die Agenten, Schlussfolgerungen und Codierungsfähigkeiten abdecken.
Öffentliche Benchmark-Ergebnisse
GLM-4.6 wurde anhand von acht öffentlichen Benchmarks bewertet und zeigt deutliche Verbesserungen gegenüber GLM-4.5. Es erreicht die höchste Leistung unter den Open-Source-Modellen. Es ist konkurrenzfähig mit führenden Modellen wie DeepSeek-V3.2-Exp und Claude Sonnet 4, bleibt jedoch in Bezug auf die reine Programmierfähigkeit hinter Claude Sonnet 4.5 zurück.

Leistung in der Praxis (CC-Bench)
Bei der erweiterten CC-Bench-Evaluierung verwendeten menschliche Prüfer GLM-4.6 in isolierten Docker-Containern, um mehrstufige Aufgaben in den Bereichen Front-End-Entwicklung, Tool-Erstellung, Datenanalyse, Tests und Algorithmusimplementierung abzuschließen.
Die Ergebnisse zeigen, dass GLM-4.6 eine nahezu gleichwertige Leistung wie Claude Sonnet 4 erreicht und eine 48.6% Gewinnquote und übertrifft dabei andere Open-Source-Modelle deutlich.

Token-Effizienz
GLM-4.6 erledigt Aufgaben mit ca. 15 % weniger Token als GLM-4.5, was zu schnelleren Reaktionszeiten, geringeren Rechenkosten und gleichbleibender oder verbesserter Ausgabequalität führt.
Erste Schritte mit GLM-4.6 auf Novita AI Plattform
Novita AI bietet mehrere Möglichkeiten zum Zugriff auf GLM-4.6, die für unterschiedliche Kenntnisstufen und Anwendungsfälle konzipiert sind.
Nutzen Sie den Spielplatz (keine Codierung erforderlich)
neu zu registrieren und beginnen Sie zu experimentieren mit GLM-4.6 In Sekundenschnelle über eine interaktive Oberfläche. Testen Sie Eingabeaufforderungen, sehen Sie Ausgaben in Echtzeit im vollständigen 200K-Kontextfenster und vergleichen Sie GLM-4.6 mit anderen führenden Modellen. Perfekt für Prototyping und zum Verständnis der Leistungsfähigkeit des Modells vor der Erstellung vollständiger Implementierungen.
Integration über API (für Entwickler)
Verbinden Sie GLM-4.6 mit Ihren Anwendungen über Novita AI's einheitliche REST-API.
Direkte API-Integration (Python-Beispiel)
von OpenAI importiere OpenAI-Client = OpenAI (Base_URL = "https://API).novita.ai/openai", api_key="", ) model = "zai-org/glm-4.6" stream = True # oder False max_tokens = 49152 system_content = "Seien Sie ein hilfreicher Assistent" temperature = 1 top_p = 1 min_p = 0 top_k = 50 presence_penalty = 0 frequency_penalty = 0 repetition_penalty = 1 response_format = { "type": "text" } chat_completion_res = client.chat.completions.create( model=model, messages=[ { "role": "system", "content": system_content, }, { "role": "user", "content": "Hallo!", } ], stream=stream, max_tokens=max_tokens, temperature=temperature, top_p=top_p, presence_penalty=presence_penalty, frequency_penalty=frequency_penalty, response_format=response_format, extra_body={ "top_k": top_k, "repetition_penalty": repetition_penalty, "min_p": min_p } ) wenn Stream: für Chunk in chat_completion_res: drucken(chunk.choices[0].delta.content oder "", end="") sonst: drucken(chat_completion_res.choices[0].message.content)
Multi-Agent-Workflows mit OpenAI Agents SDK
Erstellen Sie anspruchsvolle Multiagentensysteme mit Plug-and-Play-Integration, Unterstützung für Übergaben, Routing und Tool-Integration mit dem vollständigen 200K-Kontextfenster.
Verbindung mit Plattformen von Drittanbietern
Kodiermittel: Integrieren Sie beliebte Codierungsassistenten wie Claude Code, Cursor, Codex, Trae, Qwen Code und Cline über OpenAI-kompatible APIs und Anthropic-kompatible APIs.
Orchestrierungsframeworks: Verbinden Sie sich mit LangChain, Dify, CrewAI und Langflow über offizielle Konnektoren.
Umarmendes Gesicht: Novita AI ist ein offizieller Inferenzanbieter für Hugging Face und gewährleistet eine breite Kompatibilität mit dem Ökosystem.
Fazit
GLM-4.6 auf Novita AI liefert das Flaggschiffmodell der neuen Generation von Zhipu AI mit einer 355B-Parameter-MoE-Architektur und einem 200K-Kontextfenster und erreicht damit die modernste Leistung unter den Open-Source-Modellen. Mit einer nahezu gleichwertigen Leistung wie Claude Sonnet 4 (48.6 % Gewinnrate) und einer um 15 % besseren Token-Effizienz als GLM-4.5 stellt GLM-4.6 einen bedeutenden Sprung nach vorne bei den verfügbaren KI-Funktionen dar.
starten Sie erkunden GLM-4.6 heute durch Novita AI's Spielplatz, API, oder Integrationen von Drittanbietern, um Ihren Entwicklungsworkflow mit außergewöhnlicher Codierungsunterstützung, verfeinertem Schreiben und leistungsstarken Argumentationsfunktionen zu verbessern.
Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle mithilfe unserer einfachen API bereitzustellen und gleichzeitig kostengünstige und zuverlässige GPU Cloud zum Erstellen und Skalieren.
Entdecken Sie mehr von Novita
Abonnieren Sie, um die neuesten Beiträge per E-Mail zu erhalten.




