ERNIE-4.5-21B-A3B-Thinking ist jetzt auf der Novita AI-Plattform verfügbar und bringt Baidus bahnbrechende Denkfähigkeiten für Entwickler und Unternehmen über unsere entwicklerfreundliche Infrastruktur. Dieses neueste Release von Baidu stellt einen bedeutenden Fortschritt bei leichtgewichtigen KI-Modellen dar und bietet eine verbesserte Schlussfolgerungstiefe und -qualität, die es von früheren Generationen abhebt.
Durch seine effiziente Mixture-of-Experts (MoE)-Architektur, die pro Token nur 3B der insgesamt 21B Parameter aktiviert, liefert ERNIE-4.5-21B-A3B-Thinking Leistung auf höchstem Niveau bei geringen Ressourcenanforderungen.
Egal, ob Sie komplexe Schlussfolgerungsanwendungen entwickeln, mathematische Löser erstellen oder fortschrittliche KI-Fähigkeiten erkunden – ERNIE-4.5-21B-A3B-Thinking auf Novita AI vereinfacht den Entwicklungsprozess durch unsere optimierte Infrastruktur und einfache Integrationsoptionen.
Aktuelle Preise auf Novita AI: 131.072 Kontext, $0,07 pro 1M Eingabe-Token, $0,28 pro 1M Ausgabe-Token
Testen Sie die ERNIE-4.5-21B-A3B-Thinking-Demo
Was ist ERNIE-4.5-21B-A3B-Thinking?
ERNIE-4.5-21B-A3B-Thinking ist ein textbasiertes Mixture-of-Experts (MoE)-Post-Training-Modell aus Baidus bahnbrechender ERNIE 4.5-Serie, die aus 10 verschiedenen Modellen besteht. Dieses Modell stellt eine bedeutende Evolution der KI-Denkfähigkeiten dar und verfügt über insgesamt 21B Parameter, von denen pro Token nur 3B aktiviert werden.
Das Modell führt drei wesentliche Verbesserungen gegenüber früheren Versionen ein:
Verbesserte Denkfähigkeiten: ERNIE-4.5-21B-A3B-Thinking liefert deutlich verbesserte Leistung bei Schlussfolgerungsaufgaben wie logischem Denken, Mathematik, Naturwissenschaften, Programmierung, Textgenerierung und akademischen Benchmarks, die normalerweise menschliche Expertise erfordern. Das Modell verfügt über eine erhöhte Denklänge, was es besonders effektiv für hochkomplexe Schlussfolgerungsaufgaben macht.
Effiziente Werkzeugnutzung: Das Modell zeigt außergewöhnliche Fähigkeiten bei der Werkzeugnutzung und Funktionsaufrufen, was es ideal für agentenbasierte Anwendungen macht. Dies ermöglicht eine nahtlose Integration mit externen Systemen und APIs für praxisnahe Anwendungen.
Erweiterte Kontextverständnis: Mit seinen verbesserten 128K-Langkontext-Fähigkeiten (131.072 Token) kann ERNIE-4.5-21B-A3B-Thinking umfangreiche Dokumente, Codebasen und komplexe Mehrrundengespräche verarbeiten, ohne Kontext oder Genauigkeit zu verlieren.
ERNIE-4.5-21B-A3B-Thinking nutzt fortschrittliche Post-Training-Techniken wie SFT (Supervised Fine-Tuning), DPO (Direct Preference Optimization) und Baidus proprietäres UPO (Unified Preference Optimization). Das Modell gibt Transformer-ähnliche Gewichte frei, um mit der breiteren Community kompatibel zu sein, und gewährleistet Kompatibilität mit sowohl dem PyTorch- als auch dem PaddlePaddle-Ökosystem, einschließlich vLLM und FastDeploy. Diese breite Kompatibilität macht die Integration in bestehende Workflows einfach, während die Recheneffizienz mit nur einer 80-GB-GPU-Anforderung erhalten bleibt.
Erkunden Sie ERNIE-4.5-21B-A3B-Thinking im Novita AI Playground →
Modellspezifikationen
ERNIE-4.5-21B-A3B-Thinking verwendet eine ausgefeilte Mixture-of-Experts-Architektur, die sowohl auf Leistung als auch auf Effizienz optimiert ist. Das Design des Modells ermöglicht die selektive Aktivierung der relevantesten Experten für jedes Token und erreicht so ein optimales Gleichgewicht zwischen Fähigkeit und Rechenkosten.
Kernspezifikationen:
- Gesamtparameter: 21B
- Aktivierte Parameter: 3B pro Token
- Ebenen: 28
- Aufmerksamkeitsköpfe: 20 Query-Köpfe / 4 Key-Value-Köpfe
- Textexperten: 64 insgesamt / 6 aktiviert pro Token
- Geteilte Experten: 2
- Kontextlänge: 131.072 Token
- Maximale Ausgabe: 65.536 Token
- Ein-/Ausgabefähigkeiten: Text
- Trainingsstufe: Post-Training
- Anbieter: Baidu
- Lizenz: Apache 2.0
- Quantisierung: FP8
- GPU-Anforderung: 80GB × 1 GPU
- Schlussfolgerungsunterstützung: Ja
Die MoE-Architektur von ERNIE-4.5-21B-A3B-Thinking stellt einen Durchbruch im effizienten KI-Design dar und erbt Innovationen aus der breiteren ERNIE 4.5-Serie, einschließlich modalitätsisoliertem Routing und Router-orthogonalen Verlusttechniken. Durch die Aktivierung von nur 3B Parametern pro Token bei gleichzeitigem Zugriff auf insgesamt 21B Parameter liefert das Modell unternehmensgerechte Leistung ohne den typischen rechenseitigen Overhead.
Das 131.072 Token große Kontextfenster und die 65.536 Token Ausgabefähigkeit des Modells ermöglichen die Verarbeitung umfangreicher Dokumente und die Generierung umfassender Antworten, was es ideal für komplexe Analyseaufgaben, die Erstellung langer Inhalte und detaillierte technische Dokumentation macht.
Leistungshighlights
ERNIE-4.5-21B-A3B-Thinking zeigt eine außergewöhnliche Leistung in mehreren Bereichen und erzielt als Teil der ERNIE 4.5-Familie State-of-the-Art (SOTA)-Ergebnisse. Die verbesserten Denkfähigkeiten und die erhöhte Schlussfolgerungstiefe des Modells machen es besonders effektiv für Aufgaben, die mehrstufige Analysen und komplexe Problemlösungen erfordern.

Zu den wichtigsten Leistungsstärken gehören:
- Logisches Denken: ERNIE-4.5-21B-A3B-Thinking zeichnet sich bei komplexen logischen Deduktionsaufgaben aus und zeigt überlegene Leistung bei Rätseln, Syllogismen und mehrstufigen Schlussfolgerungsproblemen, die sorgfältige Analyse und systematisches Denken erfordern.
- Mathematik: Das Modell zeigt fortgeschrittene mathematische Problemlösungsfähigkeiten und bewältigt alles von einfacher Arithmetik bis hin zu komplexer Analysis, linearer Algebra und abstrakten mathematischen Konzepten mit hoher Genauigkeit.
- Naturwissenschaften: Verbesserte wissenschaftliche Schlussfolgerungs- und Analysefähigkeiten ermöglichen es ERNIE-4.5-21B-A3B-Thinking, Probleme in Physik, Chemie, Biologie und anderen wissenschaftlichen Bereichen zu lösen und detaillierte Erklärungen sowie genaue Lösungen bereitzustellen.
- Programmierung: Mit verbesserten Code-Generierungs- und Debugging-Fähigkeiten in mehreren Programmiersprachen kann das Modell Code schreiben, analysieren und optimieren und gleichzeitig klare Erklärungen von Programmierkonzepten und Best Practices liefern.
- Textgenerierung: Hochwertige natürliche Sprachgenerierung macht ERNIE-4.5-21B-A3B-Thinking ideal für kreatives Schreiben, technische Dokumentation und Content-Erstellungsaufgaben, die differenziertes Verständnis und Ausdruck erfordern.
- Akademische Benchmarks: Das Modell erzielt wettbewerbsfähige Leistung bei Benchmarks, die menschliche Expertise erfordern, und demonstriert seine Eignung für professionelle und akademische Anwendungen.
Testen Sie die Fähigkeiten von ERNIE-4.5-21B-A3B-Thinking im Novita AI Playground →
Erste Schritte mit ERNIE-4.5-21B-A3B-Thinking auf der Novita AI-Plattform
Novita AI bietet mehrere Zugriffsmöglichkeiten auf ERNIE-4.5-21B-A3B-Thinking, die auf unterschiedliche technische Kenntnisstände und Anwendungsfälle zugeschnitten sind. Egal, ob Sie ein Geschäftsanwender sind, der KI-Fähigkeiten erkundet, oder ein Entwickler, der Produktionsanwendungen erstellt – unsere Plattform bietet die Tools und die Flexibilität, die Sie benötigen.
Nutzen Sie den Playground (Jetzt verfügbar – Keine Programmierkenntnisse erforderlich)
Der Novita AI Playground bietet die schnellste Möglichkeit, die Fähigkeiten von ERNIE-4.5-21B-A3B-Thinking ohne technische Einrichtung kennenzulernen:
Sofortiger Zugriff: Registrieren Sie sich und beginnen Sie innerhalb von Sekunden mit dem Experimentieren mit ERNIE-4.5-21B-A3B-Thinking. Für erste Tests sind keine API-Schlüssel oder Konfiguration erforderlich.
Interaktive Oberfläche: Testen Sie Prompts und visualisieren Sie Ausgaben in Echtzeit mit unserer intuitiven Weboberfläche. Passen Sie Parameter wie Temperatur (Standard 0,7), maximale Token (bis zu 65.536) und System-Prompts an, um zu sehen, wie sie das Modellverhalten beeinflussen.
Modellkonfiguration: Passen Sie Antwortformat, Temperatur, Top-p, Min-p, Top-k, Presence-Penalty, Frequency-Penalty und Repetition-Penalty an, um Ausgaben für Ihren spezifischen Anwendungsfall zu optimieren.
Der Playground ist perfekt für Prototyping, das Testen von Ideen und das Verständnis der Modellfähigkeiten vor der vollständigen Implementierung. Exportieren Sie Ihre erfolgreichen Prompts und Konfigurationen direkt in Code für einen nahtlosen Übergang zur Produktion.
Starten Sie das Testen von ERNIE-4.5-21B-A3B-Thinking im Playground →
Integration über API (Live und einsatzbereit – Für Entwickler)
Für Produktionsbereitstellungen bietet Novita AI robusten API-Zugriff auf ERNIE-4.5-21B-A3B-Thinking mit unternehmensgerechter Zuverlässigkeit und Leistung über OpenAI-kompatible Endpunkte.
Direkte API-Integration (Python-Beispiel)
Verbinden Sie ERNIE-4.5-21B-A3B-Thinking mit Ihren Anwendungen über unsere OpenAI-kompatible API:
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key="",
)
model = "baidu/ernie-4.5-21B-a3b-thinking"
stream = True # or False
max_tokens = 32768
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Zusätzliche SDK-Unterstützung ist für TypeScript, Java, Go und Shell verfügbar, um eine nahtlose Integration über verschiedene Technologie-Stacks hinweg zu ermöglichen.
Multi-Agent-Workflows mit dem OpenAI Agents SDK
Erstellen Sie anspruchsvolle Multi-Agent-Systeme, die die verbesserten Denkfähigkeiten von ERNIE-4.5-21B-A3B-Thinking nutzen:
- Plug-and-Play-Integration: Nutzen Sie ERNIE-4.5-21B-A3B-Thinking in jedem OpenAI Agents-Workflow ohne Modifikation
- Erweiterte Agenten-Fähigkeiten: Volle Unterstützung für Übergaben, Routing und Werkzeugintegration für komplexe Workflows
- Funktionsaufrufe: Nutzen Sie JsonSchema-Definitionen für strukturierte Interaktionen und Werkzeugnutzung
Bereitstellungsoptionen
Novita AI bietet flexible Bereitstellungsoptionen, die auf Ihre spezifischen Anforderungen und Nutzungsmuster abgestimmt sind.
Serverlose API
ERNIE-4.5-21B-A3B-Thinking ist über Novitas serverlose API für sofortigen Zugriff und Pay-per-Token-Preise verfügbar:
- Keine Einrichtung erforderlich: Nutzen Sie das Modell sofort ohne Infrastrukturverwaltung
- Pay-per-Use-Preise: $0,07 pro 1M Eingabe-Token, $0,28 pro 1M Ausgabe-Token
- OpenAI-kompatible Endpunkte: Direkter Ersatz für bestehende OpenAI-Integrationen
- Automatische Skalierung: Bewältigen Sie variable Arbeitslasten ohne Kapazitätsplanung
On-Demand-Bereitstellungen
Für Anwendungen mit hohem Volumen oder Latenzanforderungen bieten On-Demand-Bereitstellungen dedizierte Ressourcen:
- Hochleistungs-Serving-Stack: Optimierte Inferenz-Engine für maximalen Durchsatz
- Hohe Zuverlässigkeit: Dedizierte GPU-Ressourcen gewährleisten konsistente Leistung
- Keine Ratenlimits: Skalieren Sie nach Ihren Bedürfnissen ohne künstliche Einschränkungen
- GPU-Anforderungen: 80 GB VRAM (empfohlen: NVIDIA A100 80 GB oder H100 80 GB für optimale Leistung)
Verbindung mit Drittanbieter-Plattformen
ERNIE-4.5-21B-A3B-Thinking auf Novita AI integriert sich nahtlos in Ihr bestehendes Entwicklungsökosystem:
Entwicklungstools: Direkte Integration mit beliebten IDEs und Entwicklungsumgebungen wie Cursor, Cline, Continue und Codex, Qwen Code über OpenAI-kompatible APIs.
Orchestrierungs-Frameworks: Native Unterstützung für LangChain, Dify, CrewAI, Langflow und andere KI-Orchestrierungsplattformen über offizielle Connectors.
Hugging Face Integration: Als offizieller Inferenz-Anbieter für Hugging Face gewährleistet Novita AI breite Ökosystemkompatibilität und einfache Modellbereitstellung.
Fazit
ERNIE-4.5-21B-A3B-Thinking auf Novita AI stellt einen Durchbruch im effizienten KI-Schlussfolgern dar und bietet Entwicklern und Organisationen Zugriff auf Baidus fortschrittlichste Denkfähigkeiten über unsere zuverlässige, skalierbare Plattform.
Die einzigartige Kombination aus verbesserter Schlussfolgerungstiefe, effizienter Werkzeugnutzung und 131K-Kontextverständnis des Modells macht es zur idealen Wahl für komplexe Schlussfolgerungsaufgaben. Mit nur 3B aktivierten Parametern, die Leistung auf 21B-Parameter-Niveau liefern, und einem GPU-Speicherbedarf von nur 80 GB bietet ERNIE-4.5-21B-A3B-Thinking ein unübertroffenes Gleichgewicht aus Fähigkeit und Effizienz.
Bereit, die Leistungsfähigkeit von ERNIE-4.5-21B-A3B-Thinking zu erleben? Unser Playground bietet sofortigen Zugriff ohne Einrichtung – perfekt, um die Modellfähigkeiten zu erkunden und Ihre Anwendungsfälle zu testen. Beginnen Sie mit unserer interaktiven Oberfläche, um die Stärken des Modells kennenzulernen, und wechseln Sie dann nahtlos zur API-Integration, wenn Sie bereit für die Produktionsbereitstellung sind.
Greifen Sie jetzt auf ERNIE-4.5-21B-A3B-Thinking im Novita AI Playground zu →
Transformieren Sie Ihre Projekte mit fortschrittlichem KI-Schlussfolgern für nur $0,07 pro Million Eingabe-Token. Beginnen Sie in Sekunden mit der Erkundung!
Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle über unsere einfache API bereitzustellen, und gleichzeitig eine erschwingliche und zuverlässige GPU-Cloud für die Erstellung und Skalierung bereitstellt.
