GLM-4.6 jetzt auf Novita AI verfügbar: Zai-orgs neues Flaggschiff-Modell der nächsten Generation mit 200K-Kontextfenster

Inhaltsverzeichnis

Was ist GLM-4.6?
Leistungsbenchmarks
Erste Schritte mit GLM-4.6 auf der Novita AI-Plattform
Fazit

GLM-4.6 ist jetzt auf der Novita AI-Plattform verfügbar und bringt Zai-orgs neues Flaggschiff-Modell der nächsten Generation mit deutlichen Verbesserungen bei Kontextlänge, Programmierleistung und agentischen Fähigkeiten. Mit einer 355B-Parameter-MoE-Architektur (Mixture of Experts) und branchenführender Leistung unter den Open-Source-Modellen stellt GLM-4.6 einen bedeutenden Fortschritt bei den KI-Fähigkeiten dar.

Mit dieser neuesten Version wurde das Kontextfenster von 128K auf 200K Token verdoppelt, während es bei realen Programmieraufgaben eine nahezu vergleichbare Leistung wie Claude Sonnet 4 erreicht. Egal, ob Sie KI-Agenten erstellen, komplexe Anwendungen entwickeln oder Automatisierungslösungen aufbauen – GLM-4.6 bietet über die entwicklerfreundliche Infrastruktur von Novita AI genau die Fähigkeiten, die Sie benötigen.

Aktuelle Preise auf Novita AI: 204.800 Kontext, $0,6 pro 1M Eingabe-Token, $2,2 pro 1M Ausgabe-Token

GLM-4.6 Demo testen

Was ist GLM-4.6?

GLM-4.6 ist das neue Flaggschiff-Modell der nächsten Generation von Zhipu AI, das deutliche Verbesserungen gegenüber GLM-4.5 bietet und branchenführende Leistung unter den Open-Source-Modellen erreicht. Mit einer 355B-Parameter-MoE-Architektur wurde es speziell dafür entwickelt, bei Agent-Aufgaben, Programmieranwendungen und komplexen Schlussfolgerungsszenarien zu glänzen.

Erweitertes Kontextfenster: GLM-4.6 verfügt über ein 200K-Token-Kontextfenster (gegenüber 128K bei GLM-4.5), sodass es komplexere Gespräche verarbeiten und größere Codebasen verarbeiten kann. Diese Erweiterung ermöglicht es Entwicklern, mit umfangreichen Dokumentationen zu arbeiten, längere Code-Dateien zu analysieren und den Kontext über anspruchsvolle Agent-Workflows hinweg beizubehalten.

Überlegene Programmierleistung: GLM-4.6 zeigt deutliche Verbesserungen in mehreren Benchmarks und eine außergewöhnliche Leistung in der Praxis bei beliebten Programmierassistenten wie Claude Code, Cline, Roo Code und Kilo Code. Das Modell glänzt besonders bei der Erstellung visuell ansprechender Frontend-Seiten und der Bewältigung komplexer Entwicklungsaufgaben mit höherer Genauigkeit.

Verbesserte Schlussfolgerungsfähigkeiten: Die Schlussfolgerungsfähigkeiten des Modells wurden durch die Unterstützung der Tool-Nutzung während der Inferenz gestärkt, was zu einer besseren Leistung bei Problemlösungsszenarien führt. GLM-4.6 integriert sich effektiver in Agent-Frameworks und eignet sich daher ideal für den Aufbau KI-gestützter Automatisierungssysteme, die mehrstufige Schlussfolgerungen und die Integration externer Tools erfordern.

Verbesserte Schreibqualität: GLM-4.6 erzeugt Texte, die besser den menschlichen Präferenzen in Bezug auf Stil und Lesbarkeit entsprechen, und verhält sich natürlicher in Rollenspielszenarien und Aufgaben zur Inhaltsgenerierung.

Leistungsbenchmarks

GLM-4.6 zeigt eine starke Leistung in umfassenden Bewertungen, die Agent-Funktionen, Schlussfolgerungsfähigkeiten und Programmierfähigkeiten abdecken.

Öffentliche Benchmark-Ergebnisse

Bei der Bewertung in acht öffentlichen Benchmarks zeigt GLM-4.6 deutliche Verbesserungen gegenüber GLM-4.5 und erreicht branchenführende Leistung unter den Open-Source-Modellen. Es ist wettbewerbsfähig gegenüber führenden Modellen wie DeepSeek-V3.2-Exp und Claude Sonnet 4, liegt aber bei reinen Programmieraufgaben noch hinter Claude Sonnet 4.5 zurück.

Praxisleistung (CC-Bench)

In der erweiterten CC-Bench-Bewertung nutzten menschliche Bewerter GLM-4.6 in isolierten Docker-Containern, um mehrrundige Aufgaben in den Bereichen Frontend-Entwicklung, Tool-Erstellung, Datenanalyse, Testing und Algorithmus-Implementierung zu absolvieren.

Die Ergebnisse zeigen, dass GLM-4.6 eine nahezu vergleichbare Leistung wie Claude Sonnet 4 erreicht, mit einer Siegerquote von 48,6 % und deutlich besserer Leistung als andere Open-Source-Modelle.

Token-Effizienz

GLM-4.6 absolviert Aufgaben mit etwa 15 % weniger Token als GLM-4.5, was zu schnelleren Antwortzeiten, niedrigeren Rechenkosten und gleichbleibender oder verbesserter Ausgabequalität führt.

Erste Schritte mit GLM-4.6 auf der Novita AI-Plattform

Novita AI bietet mehrere Möglichkeiten, auf GLM-4.6 zuzugreifen, die auf unterschiedliche Kenntnisstände und Anwendungsfälle abgestimmt sind.

Playground nutzen (keine Programmierkenntnisse erforderlich)

Registrieren und beginnen Sie innerhalb von Sekunden mit dem Experimentieren mit GLM-4.6 über eine interaktive Oberfläche. Testen Sie Prompts, sehen Sie Ausgaben in Echtzeit mit dem vollen 200K-Kontextfenster und vergleichen Sie GLM-4.6 mit anderen führenden Modellen. Perfekt für Prototyping und um zu verstehen, was das Modell leisten kann, bevor Sie vollständige Implementierungen erstellen.

Über API integrieren (für Entwickler)

Verbinden Sie GLM-4.6 mit Ihren Anwendungen über die einheitliche REST-API von Novita AI.

Direkte API-Integration (Python-Beispiel)

 from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key="",
)

model = "zai-org/glm-4.6"
stream = True # or False
max_tokens = 49152
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Multi-Agent-Workflows mit OpenAI Agents SDK

Erstellen Sie anspruchsvolle Multi-Agent-Systeme mit Plug-and-Play-Integration, Unterstützung für Übergaben, Routing und Tool-Integration mit dem vollen 200K-Kontextfenster.

Mit Plattformen von Drittanbietern verbinden

Programmier-Agenten: Integrieren Sie beliebte Programmierassistenten wie Claude Code, Cursor, Codex, Trae, Qwen Code und Cline über OpenAI-kompatible APIs und Anthropic-kompatible APIs.

Orchestrierungs-Frameworks: Verbinden Sie sich mit LangChain, Dify, CrewAI und Langflow über offizielle Konnektoren.

Hugging Face: Novita AI ist ein offizieller Inferenz-Anbieter für Hugging Face und gewährleistet eine breite Ökosystem-Kompatibilität.

Fazit

GLM-4.6 auf Novita AI bietet das neue Flaggschiff-Modell der nächsten Generation von Zhipu AI mit einer 355B-Parameter-MoE-Architektur und 200K-Kontextfenster, das branchenführende Leistung unter den Open-Source-Modellen erreicht. Mit nahezu vergleichbarer Leistung wie Claude Sonnet 4 (Siegerquote 48,6 %) und 15 % besserer Token-Effizienz als GLM-4.5 stellt GLM-4.6 einen bedeutenden Sprung nach vorne bei den zugänglichen KI-Fähigkeiten dar.

Beginnen Sie noch heute mit der Erkundung von GLM-4.6 über den Playground und die API von Novita AI oder Integrationen von Drittanbietern, um Ihren Entwicklungs-Workflow mit herausragender Programmierunterstützung, verbesserter Schreibfunktion und leistungsstarken Schlussfolgerungsfähigkeiten zu optimieren.

Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle über unsere einfache API bereitzustellen, und gleichzeitig eine kostengünstige und zuverlässige GPU-Cloud für die Entwicklung und Skalierung bereitstellt.

GLM-4.6 jetzt auf Novita AI verfügbar: Zai-orgs neues Flaggschiff-Modell der nächsten Generation mit 200K-Kontextfenster

Was ist GLM-4.6?