Qwen3.7-Max auf Novita AI: Agentisches Codieren für Long-Context-Workflows
Qwen3.7-Max ist auf Novita AI über die Serverless API für Entwickler verfügbar, die agentische Codiersysteme, Long-Context-Assistenten und toolgestützte Text-Workflows erstellen. Auf der Novita AI-Modellseite wird der Endpunkt als qwen/qwen3-max geführt. Verwenden Sie daher diese Modell-ID beim Aufruf der API, auch wenn Ihr Artikel, Ihre Roadmap oder Ihre Launch-Notes den Produktnamen Qwen3.7-Max verwenden.
Das Modell ist für Agent Builder relevant, da Qwens Launch-Material Repository-Bearbeitung, terminalähnliche Aufgaben, Planung, Instruktionsbefolgung und lange autonome Ausführungen hervorhebt. Die praktische Schlussfolgerung ist einfach: Teams können dieses Modell über Novita AIs OpenAI-kompatible Serverless API testen und dann bewerten, ob sein agentenfokussiertes Verhalten ihre eigenen Code- und Automatisierungs-Workflows verbessert.
Starten Sie auf der Qwen3 Max-Modellseite auf Novita AI oder verbinden Sie sich über die Novita AI OpenAI-kompatible API. Orientieren Sie sich bei Preisen, Context-Limits und Modell-ID an der Novita AI-Listung, die Sie in der Produktion verwenden.
Verfügbarkeit von Qwen3.7-Max auf Novita AI
Novita AI listet Qwen3 Max mit der Modell-ID qwen/qwen3-max und gibt an, dass es über Novitas Serverless API verfügbar ist. Die API-Beispiele auf der Modellseite verwenden die OpenAI-kompatible Basis-URL https://api.novita.ai/openai und den Modellwert qwen/qwen3-max.
| Verfügbarkeitspunkt | Novita AI-Listung |
|---|---|
| Titel der Novita-Modellseite | Qwen3 Max |
| Modell-ID für API-Aufrufe | qwen/qwen3-max |
| Zugangspfad | Novita AI Serverless API |
| API-Basis-URL | https://api.novita.ai/openai |
| Eingabefähigkeit | Text |
| Ausgabefähigkeit | Text |
| Modellseite | Qwen3 Max auf Novita AI |
Zuletzt überprüft: 22.05.2026 auf der Novita AI-Modellseite.
Qwens externes Launch-Material behandelt auch Bailian-Verfügbarkeit, regionale Bereitstellungsmodi, Anthropic-API-Kompatibilität, Responses-API-Tools, Thinking- und Non-Thinking-Modi sowie preserve_thinking für langlaufende Agentenaufgaben. Betrachten Sie dies als Launch- und Provider-Kontextdetails. Verwenden Sie für diesen Novita AI-Endpunkt die Novita-Modellseite als Quelle der Wahrheit für Modell-ID, Serverless-API-Pfad, Limits und Preise.
Novita AI-Endpunktspezifikationen
Der Novita AI-Endpunkt eignet sich für textorientierte Agent-Workflows, die große Kontextfenster, strukturierte Antworten und tool-kompatible Ausgaben benötigen. Die angegebene Kontextlänge beträgt 262144 Token und die maximale Ausgabe 65536 Token.
| Spezifikation | Qwen3 Max auf Novita AI |
|---|---|
| Anbieter | Qwen |
| Quantisierung | fp8 |
| Kontextlänge | 262144 |
| Maximale Ausgabe | 65536 |
| Serverless | Unterstützt |
| Function Calling | Unterstützt |
| Structured Output | Unterstützt |
| Eingabe-/Ausgabefähigkeiten | Text / Text |
Zuletzt überprüft: 22.05.2026 auf der Novita AI-Modellseite.
Einige Qwen-Launch-Materialien beschreiben ein 1M-Token-Kontextfenster für Qwen3.7-Max. Dies ist eine Behauptung aus dem Launch-Material und sollte nicht als aktuelles Limit des Novita AI-Endpunkts betrachtet werden. Für die Nutzung und Kostenplanung auf Novita AI beträgt die angegebene Endpunkt-Kontextlänge 262144 Token.
Aufruf von Qwen3.7-Max über Novita AI
Novita AI stellt das Modell über eine OpenAI-kompatible Schnittstelle bereit. Das wesentliche Implementierungsdetail ist die Modell-ID: Rufen Sie qwen/qwen3-max auf, nicht einen erratenen Endpunktnamen basierend auf dem Qwen3.7-Max-Launch-Label.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key="IHR_NOVITA_API_KEY",
)
response = client.chat.completions.create(
model="qwen/qwen3-max",
messages=[
{"role": "system", "content": "You are a careful coding assistant."},
{"role": "user", "content": "Summarize the failing tests and suggest a fix plan."},
],
max_tokens=4096,
temperature=0.2,
)
print(response.choices[0].message.content)
Für produktive Agent-Workflows behalten Sie separate Grenzwerte für Ausgabe-Token, Anzahl der Tool-Aufrufe, Ausführungszeit und Wiederholungsverhalten bei. Eine maximale Ausgabe von 65536 Token bietet Platz für lange Reasoning-Spuren oder detaillierte Bearbeitungen, aber die meisten Codier-Agent-Aufgaben profitieren dennoch von begrenzten Antworten und expliziten Überprüfungsschritten.
Novita AI-Preise für Qwen3 Max
Novita AI listet sowohl Kopfpreise pro Million Token als auch gestaffelte Preise nach Eingabelänge. Verwenden Sie für Novita-Abrechnungsentscheidungen die Novita AI-Modellseite; Qwen- oder Alibaba-Cloud-Preise können nützlicher externer Provider-Kontext sein, sollten aber nicht in Novita AI-Preistabellen eingemischt werden.
| Eingabelänge | Eingabepreis | Ausgabepreis |
|---|---|---|
| 1 bis 32767 Token | $0.845 / M Token | $3.38 / M Token |
| 32768 bis 131071 Token | $1.40 / M Token | $5.64 / M Token |
| 131072 bis 258047 Token | $2.11 / M Token | $8.45 / M Token |
Zuletzt überprüft: 22.05.2026 auf der Novita-Modellseite. Die Modellseite listet auch Kopfpreise für Eingabe/Ausgabe von $2.11 / M Token und $8.45 / M Token.
Die Preisstufen sind für agentisches Codieren relevant, da ein langer Repository-Kontext, wiederholte Tool-Zusammenfassungen und ausführliche Ausgaben eine Anfrage in eine höhere Stufe verschieben können. Testen Sie vor der Skalierung repräsentative Aufgaben mit tatsächlichem Kontext-Packing, Retrieval und Ausgabelimits, sodass die gemessenen Kosten Ihr tatsächliches Scaffold widerspiegeln.
Warum Qwen3.7-Max für agentisches Codieren wichtig ist
Codier-Agenten sind nicht mehr auf kurze Code-Complete-Prompts beschränkt. Sie lesen Issue-Threads, durchsuchen Repositories, führen Befehle aus, behandeln Fehler, modifizieren Dateien und validieren Ergebnisse durch Tests oder menschliche Überprüfung. In diesem Szenario muss das Modell Anweisungen über lange Kontexte hinweg beibehalten, Tools zuverlässig auswählen und sich erholen, wenn Zwischenschritte fehlschlagen.
Qwens Launch-Material hebt agentisches Codieren und Tool-Use-Benchmarks hervor, wie Terminal-Bench 2.0 Terminus 72.3, SWE-Pro 60.4, SWE-Multilingual 78.4, NL2Repo 47.3, SciCode 52.7, MCP-Mark 64.6, Deep-Planning 63.1, GPQA Diamond 92.2, IFBench 81.2 und SpreadSheetBench 84.5. Dies sind nützliche Richtungssignale, sollten aber als von Qwen berichtete Launch-Benchmarks betrachtet werden, nicht als Garantien für eine private Codebasis.
Das bessere Evaluierungsmuster besteht darin, einen privaten Aufgabensatz aus Ihrer eigenen Arbeit zu erstellen: fehlschlagende Tests, Abhängigkeitsupgrades, Fehlerbehebungen, Refactorings mit Akzeptanzkriterien, dokumentationsverknüpfte Änderungen und tool-intensive Automatisierungsabläufe. Führen Sie Qwen3.7-Max über Novita AI mit demselben Scaffold, Timeout, Retrieval-Einstellungen und Bewertungsraster aus, das Sie für Ihre aktuelle Baseline verwenden.
Geeignete Anwendungsfälle
Qwen3.7-Max auf Novita AI ist eine starke Wahl, wenn der Workload textorientiert, kontextintensiv und toolorientiert ist. Die Unterstützung für Structured Output und Function Calling macht den Endpunkt besonders relevant für Agent-Frameworks, die vorhersagbare Zwischendaten oder Tool-Argumente benötigen.
- Repository-basierte Codier-Agenten, die Dateien prüfen, Patches vorschlagen und über Testergebnisse nachdenken.
- Long-Context-Engineering-Assistenten, die Issue-Verläufe, Pull-Request-Feedback und Quelldateien zusammenfassen.
- Büro- und Datenautomatisierungs-Agenten, die Extraktion, Tabellenlogik und strukturierte Ausgabe kombinieren.
- Forschungsassistenten, die Textextraktion, Planung und mehrstufige Synthese benötigen.
- Tool-Calling-Systeme, bei denen Function Calling und Structured Output Kernanforderungen sind.
Es ist nicht die erste Wahl für natives Bild- oder Videoverständnis, da die Novita AI-Listung Texteingabe und Textausgabe zeigt. Es könnte auch mehr Modell als nötig für einfache Extraktion, Klassifikation oder Routing-Aufgaben sein, bei denen ein kleineres und kostengünstigeres Modell die Qualitätsschwelle erfüllt.
Wie Teams es evaluieren sollten
Evaluieren Sie Qwen3.7-Max mit aufgabenbezogenen Metriken, nicht mit Prompteindrücken. Verfolgen Sie für Codier-Agenten die Abschlussrate, Testbestehensrate, Überprüfungsinterventionsrate, Anzahl der Tool-Aufrufe, Wanduhrzeit, Eingabe-Token, Ausgabe-Token und Regressionsrate. Für Geschäftsautomatisierungs-Agenten verfolgen Sie Extraktionsgenauigkeit, Schema-Gültigkeit, Akzeptanz nachgelagerter Systeme und menschliche Korrekturzeit.
- Wählen Sie 20 bis 50 reale Aufgaben aus, die Ihren Ziel-Agent-Workload repräsentieren.
- Frieren Sie das Scaffold, die Tools, Retrieval-Einstellungen, Timeouts und die Wiederholungsrichtlinie ein.
- Führen Sie den Novita AI-Endpunkt
qwen/qwen3-maxund Ihre aktuelle Baseline unter denselben Bedingungen aus. - Bewerten Sie die Ergebnisse mit Tests, strukturierten Rubriken und menschlicher Überprüfung.
- Vergleichen Sie die Qualität mit den gesamten Eingabe-Token, Ausgabe-Token, Latenz und Kosten pro Stufe.
Wenn Ihre Evaluierung Codeausführung oder Browserautomatisierung umfasst, kombinieren Sie das Modelltesten mit einer isolierten Laufzeitumgebung. Novita AI Agent Sandbox kann kontrollierte Ausführungsumgebungen für Agent-Workflows unterstützen, während die Qwen3 Max-Modellseite der direkte Einstiegspunkt zum Testen dieses Modells über Novita AI ist.
FAQ
Ist Qwen3.7-Max auf Novita AI verfügbar?
Ja. Novita AI listet Qwen3 Max als über die Serverless API mit der Modell-ID qwen/qwen3-max verfügbar.
Welche Modell-ID sollten Entwickler verwenden?
Verwenden Sie qwen/qwen3-max mit der Novita AI OpenAI-kompatiblen API-Basis-URL https://api.novita.ai/openai.
Welche Kontextlänge listet Novita AI für diesen Endpunkt?
Die Novita AI-Modellseite listet eine Kontextlänge von 262144 Token und eine maximale Ausgabe von 65536 Token für den qwen/qwen3-max-Endpunkt.
Unterstützt der Novita AI-Endpunkt Function Calling und Structured Output?
Ja. Novita AI listet sowohl Function Calling als auch Structured Output als unterstützt für qwen/qwen3-max.
Fazit
Qwen3.7-Max ist jetzt eine verifizierte Novita AI-Modell-Launch-Story, nicht nur ein externes Provider-Update. Verwenden Sie die Novita AI Serverless API-Modell-ID qwen/qwen3-max, planen Sie mit der angegebenen Kontextlänge von 262144 Token und der maximalen Ausgabe von 65536 Token, und evaluieren Sie das Modell an realen agentischen Codier- und Long-Context-Workflows, bevor Sie die Produktionsnutzung skalieren.
