Ling-2.6-1T auf Novita AI: Kostenlose API, SWE-Bench SOTA, 1T-Param-Modell

Ling-2.6-1T auf Novita AI: Kostenlose API, SWE-Bench SOTA, 1T-Param-Modell

Die leistungsfähigsten Open-Source-Modelle zwingen dich zu einer Wahl: rohe Intelligenz oder Token-Effizienz. Denkmodelle verbrauchen 3–5× mehr Token pro Anfrage. Kleinere Nicht-Denkmodelle senken die Kosten, schränken aber die Leistungsfähigkeit ein. Ling-2.6-1T wurde entwickelt, um diesen Kompromiss zu durchbrechen.

Ling-2.6-1T ist ein umfassendes Flaggschiff-Modell im Billionen-Maßstab von der Ant Group (inclusionAI), das für die sofortige Aufgabenausführung entwickelt wurde. Aufbauend auf der MLA + Hybrid Linear Attention-Architektur erzielt es ein überlegenes Intelligenz-zu-Token-Verhältnis: starke Benchmark-Leistung bei minimalem Overhead an Ausgabe-Token. Bei AIME26 übertrifft es andere Nicht-Denkmodelle deutlich. Bei Agenten-Ausführungs-Benchmarks — SWE-bench Verified, BFCLv4, TAU2-Bench, Claw-Eval — erreicht es Open-Source-SOTA. Es wird jetzt exklusiv von Novita AI als Inferenzanbieter unterstützt.

Kurz gesagt: Ling-2.6-1T bietet umfassende Grenzbereichsleistung für Agenten-Workloads — komplexes Reasoning, Tool-Nutzung, mehrstufige Ausführung und langkontextbezogene Befehlsausführung — zu einem Bruchteil der Token-Kosten von Denkmodellen.

Ling-2.6-1T mit Novita AI ausprobieren

Was ist Ling-2.6-1T?

Ling-2.6-1T ist das neueste Flaggschiff-Modell von inclusionAI, dem KI-Forschungszweig der Ant Group (AntLingAGI). Es ist ein 1-Billionen-Parameter-Mixture-of-Experts-Modell — das größte bisher veröffentlichte, mit FP8 trainierte Foundation-Modell — trainiert auf 20 Billionen+ hochwertigen Token mit über 40% reasoning-intensiven Daten in späteren Phasen.

Im Gegensatz zu Denkmodellen (DeepSeek-R1, QwQ), die vor der Antwort lange Chain-of-Thought-Spuren ausgeben, verwendet Ling-2.6-1T einen „Fast-Thinking"-Mechanismus: Es internalisiert das Reasoning, ohne ausführliche Gedankenketten zu externalisieren. Dies hält die Token-Ausgabe schlank, während eine starke analytische Tiefe erhalten bleibt. ~50 Milliarden Parameter aktivieren pro Token, was die Inferenz im 1T-Maßstab praktikabel macht.

  • Architektur: MLA + Hybrid Linear Attention, 1T Gesamtparameter, ~50B aktive Parameter pro Token
  • Kontextfenster: 262.144 Token (via YaRN-Rope-Scaling), max. Ausgabe 32.768 Token
  • Training: FP8-gemischte Präzision, 20B+ Token, >40% reasoning-intensiven Daten
  • Paradigma: Fast-Thinking — internalisiertes Reasoning, keine ausführliche Chain-of-Thought-Ausgabe
  • Lizenz: MIT — vollständig offene Gewichte
  • Verfügbarkeit: Exklusiv unterstützt von Novita AI (OpenRouter-Anbieter)

Hauptmerkmale: Warum Ling-2.6-1T heraussticht

Überlegenes Intelligenz-zu-Token-Verhältnis

Denkmodelle liefern beeindruckende Ergebnisse, aber sie treiben die Token-Kosten in die Höhe — Hunderte von Reasoning-Token vor der tatsächlichen Antwort. Ling-2.6-1T wurde mit Evolutionary Chain-of-Thought (Evo-CoT) im mittleren Training trainiert, wobei das Reasoning internalisiert statt externalisiert wird. Das Ergebnis: starke Benchmark-Ergebnisse auf AIME26 (übertrifft andere Nicht-Denkmodelle), LiveCodeBench und Omni-MATH — ohne für den Denkprozess zu bezahlen. Laut offizieller Modellkarte erreicht es eine Intelligenz-Ausgabe-Effizienz, die mit GPT-5.4 (Non-Reasoning) vergleichbar ist, und stellt einen großen Sprung gegenüber seinem Vorgänger Ling-1T dar. Für Produktions-Workloads mit hohem Durchsatz senkt dies direkt die Kosten.

Open-Source-SOTA bei Agentenausführung

Agenten-Workloads erfordern mehr als nur Mathematik und Codierung in Isolation — sie erfordern Tool-Nutzung, mehrstufige Ausführung und zuverlässige Befehlsausführung unter realen Bedingungen. Ling-2.6-1T erreicht Open-Source-SOTA auf den wichtigsten Agenten-Benchmarks (laut inclusionAI Modellkarte):

  • SWE-bench Verified — Lösung realer Softwareentwicklungsaufgaben
  • BFCLv4 — komplexe mehrstufige Funktions-/Tool-Aufrufe
  • TAU2-Bench — langfristige agentische Aufgabenerledigung
  • Claw-Eval — mehrstufige Befehlsausführung
  • PinchBench — zusammengesetzte Agentenfähigkeiten

Auf LiveCodeBench (August 2024–Mai 2025) erreicht es 61,68 — übertrifft DeepSeek-V3.1 (48,02), Kimi-K2-0905 (48,95) und GPT-5-main (48,57) um mehr als 13 Punkte. Bei der Frontend-Generierung liegt der ArtifactsBench-Score bei 59,31 — nur knapp hinter Gemini-2.5-Pro(lowthink) mit 60,28 in dieser Vergleichsgruppe (laut inclusionAI Modellkarte).

Langer Kontext + Befehlsausführung

Mit einem Kontext von 262.144 Token (YaRN-Rope-Scaling) kann Ling-2.6-1T ganze Codebasen, lange Dokumente oder ausgedehnte mehrstufige Agentengespräche in einem einzigen Aufruf verarbeiten. Auf dem MRCR-Benchmark (16K–256K Kontextbereich) hält es konstant die Abrufgenauigkeit — eine kritische Anforderung für Agenten-Pipelines, die lange Tool-Ausgaben oder Dokumentenkorpus verarbeiten. Der IFBench-Score beträgt 56,9%, was eine starke komplexe Befehlsausführung in erweiterten Kontexten zeigt.

Benchmark-Leistung

Unabhängige Messungen von Artificial Analysis stufen Ling-2.6-1T mit einem Intelligence-Index von 33,6 ein — besser als 73% von 495 gemessenen Modellen und #2 in der Klasse der offenen, großen Nicht-Denk-Modelle. Nachfolgend werden die selbstberichteten Werte der inclusionAI Modellkarte (im Vergleich zu DeepSeek-V3.1-terminus, Kimi-K2-0905, GPT-5-main und Gemini-2.5-Pro(lowthink)) sowie unabhängig verifizierte AA-Werte angezeigt.

Mathematik & Reasoning (laut inclusionAI Modellkarte)

Benchmark Ling-2.6-1T DeepSeek-V3.1 Kimi-K2-0905 GPT-5-main Gemini-2.5-Pro*
AIME26 70,42 55,21 50,16 59,43 70,10
Omni-MATH 74,46 64,77 62,42 61,09 72,02
OptMATH 57,68 35,99 35,84 39,16 42,77
FinanceReasoning 87,45 86,44 84,83 86,28 86,65
BBEH 47,34 42,86 34,83 39,75 29,08
KOR-Bench 76,00 73,76 73,20 70,56 59,68
ARC-AGI-1 43,81 14,69 22,19 14,06 18,94

*Gemini-2.5-Pro(lowthink). Quelle: inclusionAI Modellkarte. Zuletzt überprüft: 2026-04-24.

Code-Leistung (laut inclusionAI Modellkarte)

Benchmark Ling-2.6-1T DeepSeek-V3.1 Kimi-K2-0905 GPT-5-main Gemini-2.5-Pro*
LiveCodeBench 61,68 48,02 48,95 48,57 45,43
MultiPL-E 77,91 77,68 73,54 76,66 71,48
CodeForces Rating 1901 1582 1574 1120 1675
FullStack Bench 56,55 55,48 54,00 50,92 48,19
ArtifactsBench 59,31 43,29 44,87 41,04 60,28
Aider Code Editing 83,65 88,16 85,34 84,40 89,85

*Gemini-2.5-Pro(lowthink). Quelle: inclusionAI Modellkarte. Zuletzt überprüft: 2026-04-24. Hinweis: Die Modellversionsnamen (z.B. “gpt-5-main”, “DeepSeek-V3.1-terminus”) entsprechen den Angaben von inclusionAI und entsprechen möglicherweise nicht den öffentlich veröffentlichten Versionen.

Agentenausführungs-Benchmarks (laut inclusionAI Modellkarte)

Ling-2.6-1T erreicht Open-Source-SOTA auf agentenspezifischen Bewertungen. Exakte Wettbewerbsergebnisse sind nicht für alle Benchmarks veröffentlicht; Ergebnisse gemäß der offiziellen Modellkarte.

Benchmark Was wird gemessen Ling-2.6-1T
SWE-bench Verified Lösung realer GitHub-Issues Open-Source-SOTA
BFCLv4 Komplexe mehrstufige Funktions-/Tool-Aufrufe Open-Source-SOTA
TAU2-Bench Langfristige agentische Aufgabenerledigung Open-Source-SOTA
Claw-Eval Mehrstufige Befehlsausführung Open-Source-SOTA
PinchBench Zusammengesetzte Agentenfähigkeit Open-Source-SOTA
IFBench Komplexe Befehlsausführung 56,9%

Quelle: inclusionAI Modellkarte. “Open-Source-SOTA” wie von inclusionAI beansprucht; unabhängige Punktzahlen pro Benchmark noch nicht verfügbar. Zuletzt überprüft: 2026-04-24.

Unabhängige Benchmarks (Artificial Analysis)

Metrik Ling-2.6-1T Anmerkungen
AA Intelligence Index 33,6 Besser als 73% von 495 Modellen
AA Coding Index 33,0 Besser als 78% der Modelle
AA Agentic Index 48,2 Besser als 80% der Modelle
GPQA Diamond 75,2% Wissenschaftliches Reasoning auf Graduiertenniveau
τ²-Bench Telecom 89,8% Konversationsagentenaufgaben
IFBench 56,9% Befehlsausführung
Ausgabegeschwindigkeit 67,7 tok/s Via Novita AI auf OpenRouter

Quelle: Artificial Analysis. Zuletzt überprüft: 2026-04-24.

So verwendest du Ling-2.6-1T mit Novita AI

Option 1: Playground (Ohne Code)

Teste das Modell sofort unter novita.ai/models/model-detail/inclusionai-ling-2.6-1t — keine Einrichtung erforderlich. Nützlich, um Prompts schnell zu testen, bevor du sie in deine Anwendung integrierst.

Option 2: API (Python)

Ling-2.6-1T ist vollständig OpenAI-kompatibel. Tausche deinen Novita-API-Key und die Modell-ID ein:

from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="YOUR_NOVITA_API_KEY",
)

response = client.chat.completions.create(
    model="inclusionai/ling-2.6-1t",
    messages=[{"role": "user", "content": "Your prompt here"}],
    temperature=0.7,
    top_p=0.95,
)

print(response.choices[0].message.content)

Hole dir deinen API-Key unter novita.ai/settings. Das Modell unterstützt auch Streaming, Function Calling via tool_use und strukturierte Ausgaben.

Option 3: Drittanbieter-Tools

Da Novita AI OpenAI-kompatibel ist, funktioniert Ling-2.6-1T mit jedem Tool, das eine benutzerdefinierte Basis-URL akzeptiert — darunter Cursor, Claude Code, OpenWebUI, LangChain und LlamaIndex. Setze die Basis-URL auf https://api.novita.ai/v3/openai und das Modell auf inclusionai/ling-2.6-1t.

Anwendungsfälle

Die Kombination aus 1T-Parameter-Kapazität, Fast-Thinking-Paradigma und 262K-Kontext von Ling-2.6-1T macht es zu einer starken Wahl für:

  • Coding Agents: Mit einer CodeForces-Bewertung von 1901 und starken LiveCodeBench-Ergebnissen bewältigt es programmtechnische Aufgaben auf Wettbewerbsniveau. Kombiniere es mit Novitas Agent Sandbox für vollständig isolierte Codeausführung ohne Infrastrukturverwaltung.
  • Finanzanalyse: 87,45 auf FinanceReasoning (#1 in seiner Vergleichsgruppe laut inclusionAI Modellkarte) macht es geeignet für automatisierte Berichtsanalyse, Zusammenfassung von Gewinnberichten und quantitative Research-Workflows.
  • Frontend-Generierung: Die Hybrid Syntax–Function–Aesthetics Belohnung im Training zielt speziell auf die Qualität von UI-Code ab. Der ArtifactsBench-Wert von 59,31 ist der zweithöchste in seiner Vergleichsgruppe — nur 0,97 Punkte hinter Gemini-2.5-Pro(lowthink).
  • Langdokumentenverarbeitung: Der 262.144-Token-Kontext verarbeitet mehrere hundert Seiten lange Dokumente, vollständige Repository-Analysen oder umfangreiche juristische/forschende Textsammlungen in einem einzigen Aufruf.
  • High-Volume-Produktions-APIs: Das Nicht-Denk-Paradigma bedeutet vorhersagbare Token-Anzahlen und geringere Latenzschwankungen — wichtig, wenn du Tausende von Anfragen pro Tag ausführst.

Von DeepSeek V3 oder Kimi K2 migrieren?

Wenn du derzeit DeepSeek V3 oder Kimi K2 über einen anderen Anbieter verwendest, ist der Wechsel zu Ling-2.6-1T mit Novita AI eine einzeilige Änderung — dieselbe OpenAI-kompatible API, dasselbe Anfrageformat. Die Modell-ID wird zu inclusionai/ling-2.6-1t.

Bei Codierungsaufgaben übertrifft Ling-2.6-1T sowohl DeepSeek-V3.1 als auch Kimi-K2-0905 auf LiveCodeBench (61,68 vs. 48,02 und 48,95) und führt bei Mathematik-Reasoning sowohl auf AIME26 als auch OptMATH. Wenn deine Workloads reasoning-intensiv sind, du aber keine ausführlichen Chain-of-Thought-Ausgaben möchtest, ist dies der sauberere Upgrade-Pfad im Vergleich zum Wechsel zu einem Denkmodell.

Preise

Modell Eingabe ($/1M Token) Ausgabe ($/1M Token) Kontext
Ling-2.6-1T (Novita AI) $0,30 $2,50 262.144
DeepSeek V3.2 $0,28 $0,42 128K
Qwen3-235B-A22B $0,455 $1,82 131K
Kimi K2 (OpenRouter) $0,57 $2,30 131K

Novita AI Preise via novita.ai. Wettbewerberpreise via OpenRouter. Zuletzt überprüft: 2026-04-24.

Der Ausgabepreis von Ling-2.6-1T (2,50 $/M) ist höher als der von DeepSeek V3.2 — der Kompromiss ist eine deutlich stärkere Benchmark-Leistung bei Reasoning- und Codierungsaufgaben. Wenn die Token-Kosten pro Aufruf die primäre Einschränkung sind, ist Ling-2.6-flash (104B Parameter, 7,4B aktiv) der günstigere Geschwister-Modell und ebenfalls exklusiv über Novita AI erhältlich.

Kostenlose Stufe: Ling-2.6-1T ist kostenlos über den inclusionai/ling-2.6-1t:free-Endpunkt auf OpenRouter verfügbar, exklusiv bereitgestellt von Novita AI. Dieses kostenlose Fenster ist zeitlich begrenzt — überprüfe die aktuelle Verfügbarkeit unter openrouter.ai/inclusionai/ling-2.6-1t:free.

Fazit

Fazit: Ling-2.6-1T ist derzeit das stärkste Open-Weight-Modell ohne Denkprozess für wettbewerbsorientierte Mathematik- und Code-Benchmarks und die stärkste Open-Source-Option, wenn du 262K Kontext benötigst, ohne für ausführliche Chain-of-Thought-Ausgaben zu bezahlen. Es ist nicht die billigste Option pro Token, aber für komplexe Reasoning-Aufgaben, bei denen Denkmodelle deine Rechnung in die Höhe treiben würden, ist es die praktischste leistungsfähige Open-Source-Alternative, die derzeit verfügbar ist.

Exklusiv unterstützt von Novita AI — der einzige Anbieter, der sowohl Ling-2.6-1T als auch Ling-2.6-flash auf OpenRouter anbietet — du erhältst einen stabilen Inferenzendpunkt, 99,9% Verfügbarkeit und eine OpenAI-kompatible API, ohne selbst die Mindestbereitstellung von 32 GPUs verwalten zu müssen.

Ling-2.6-1T starten

Häufig gestellte Fragen (FAQ)

Was ist Ling-2.6-1T?

Ling-2.6-1T ist ein 1-Billionen-Parameter-Mixture-of-Experts-Sprachmodell, das von der Ant Group (inclusionAI) entwickelt wurde. Es aktiviert etwa 50 Milliarden Parameter pro Token, unterstützt ein Kontextfenster von 262.144 Token und ist als Fast-Thinking-Modell ohne Denkprozess konzipiert — starke Benchmark-Leistung ohne Chain-of-Thought-Overhead. MIT-lizenziert und vollständig offene Gewichte.

Wie greife ich über die API auf Ling-2.6-1T zu?

Setze base_url="https://api.novita.ai/v3/openai" und model="inclusionai/ling-2.6-1t" in einem beliebigen OpenAI-kompatiblen Client. Hole dir deinen API-Key unter novita.ai/settings. Es ist auch über OpenRouter mit derselben Modell-ID zugänglich.

Wie schneidet Ling-2.6-1T im Vergleich zu DeepSeek V3 ab?

Bei selbstberichteten Benchmarks (inclusionAI Modellkarte) übertrifft Ling-2.6-1T DeepSeek-V3.1 auf AIME26 (70,42 vs. 55,21), LiveCodeBench (61,68 vs. 48,02) und ARC-AGI-1 (43,81 vs. 14,69). DeepSeek V3.2 erzielt einen höheren Wert im Artificial Analysis Intelligence Index (42 vs. 34), aber Ling-2.6-1T bietet ein größeres Kontextfenster (262K vs. 128K) zu ähnlichen Preisen (0,30 $/M Eingabe).

Wie groß ist das Kontextfenster von Ling-2.6-1T?

262.144 Token (erweitert von nativen 128K via YaRN-Rope-Scaling). Maximale Ausgabelänge beträgt 32.768 Token.

Ist Ling-2.6-1T kostenlos nutzbar?

Ja, vorübergehend. Der inclusionai/ling-2.6-1t:free-Endpunkt auf OpenRouter wird exklusiv von Novita AI bereitgestellt. Das kostenlose Fenster ist zeitlich begrenzt. Die kostenpflichtige Stufe über Novita AI kostet 0,30 $/M Eingabe und 2,50 $/M Ausgabe-Token.

Empfohlene Artikel