Empfehlen Sie Ihren Freunden Novita AI und beide erhalten Sie 10 $ LLM-API-Guthaben – bis zu 500 $ Gesamtbelohnungen.
Zur Unterstützung der Entwickler-Community sind Qwen2.5-7B, Qwen 3 0.6B, Qwen 3 1.7B, Qwen 3 4B derzeit kostenlos auf Novita AI verfügbar.
Qwen3, eine KI-Modellfamilie, wurde für Entwickler entwickelt, die hochmoderne Fähigkeiten in den Bereichen Reasoning, mehrsprachige Unterstützung und leichte Effizienz suchen. Mit kostenlosem Zugang auf der Novita AI-Plattform und nahtloser API-Integration ermöglicht Qwen3 dynamische Anwendungen, von Code-Assistenz bis hin zu komplexer Problemlösung.

Hauptmerkmale von Qwen 3
Hybride Denkmodi
Qwen3-Modelle führen einen hybriden Problemlösungsansatz mit zwei Modi ein:
- Denkmodus: Bei komplexen Problemen denkt das Modell Schritt für Schritt und liefert durchdachte Antworten.
- Nicht-Denkmodus: Bei einfacheren Aufgaben liefert das Modell schnelle, nahezu sofortige Antworten.
Diese Flexibilität ermöglicht es den Benutzern, den Denkaufwand des Modells basierend auf den Aufgabenanforderungen zu steuern. Schwierigere Probleme profitieren von einer verlängerten Denkzeit, während einfachere schnell gelöst werden.
Durch die Kombination dieser Modi erreicht Qwen3 eine stabile und effiziente Denkbudgetsteuerung und bietet skalierbare Leistungsverbesserungen, die an zugewiesene Rechendenkbudgets gebunden sind. Dieses Design erleichtert die aufgabenspezifische Budgetierung und schafft ein Gleichgewicht zwischen Kosteneffizienz und Inferenzqualität.
Mehrsprachige Unterstützung
Qwen3-Modelle unterstützen 119 Sprachen und Dialekte und eröffnen neue Möglichkeiten für globale Anwendungen. Optimiert für Codierung, agentische Fähigkeiten und MCP, ermöglicht Qwen3 Benutzern weltweit, seine Leistungsfähigkeit effektiv zu nutzen.
Verbesserte agentische Fähigkeiten
Qwen3 ist für Codierung und agentische Fähigkeiten optimiert, mit verbesserter Unterstützung für MCP. Nachfolgend finden Sie Beispiele, die zeigen, wie Qwen3 denkt und mit seiner Umgebung interagiert.
Qwen 3 Small Models

Tie Embedding ist eine Technik, die häufig in Modellen der natürlichen Sprachverarbeitung (NLP) verwendet wird, um Gewichte zwischen verschiedenen Embedding-Layern zu teilen. Konkret bezieht es sich auf die Kopplung (oder gemeinsame Nutzung) der Gewichte des Eingabe-Embedding-Layers und des Ausgabe-Embedding-Layers in einem neuronalen Netzwerk, insbesondere in Sprachmodellen wie Transformatoren.
Trainingsmethoden von Qwen 3 Small Models

Aus dem Diagramm können wir ableiten, dass Qwen 3 0.6B,1.7B,4B durch einen Strong-to-Weak-Distillationsprozess trainiert wurden, der Teil der Pipeline zur Erstellung von Lightweight Models ist. Hier ist eine schrittweise Aufschlüsselung des Trainingsprozesses:
- Basis-Modelle:
Der Prozess beginnt mit vortrainierten Basis-Modellen, die die Grundlage für das anschließende Training und die Destillation bilden. - Frontier-Modelle:
- Basis-Modelle werden zunächst in einem mehrstufigen Prozess trainiert, um Frontier-Modelle wie Qwen3-235B-A22B und Qwen3-32B zu erstellen.
- Dieses Training umfasst:
- Stufe 1 (Long-CoT Cold Start): Initiales Training mit langer Chain-of-Thought (CoT) Argumentation.
- Stufe 2 (Reasoning RL): Verstärkungslernen (RL) zur Verbesserung der logischen Fähigkeiten.
- Stufe 3 (Thinking Mode Fusion): Integration von Denkmodi (z. B. Argumentations- und Schnellantwortmodi).
- Stufe 4 (General RL): Allgemeines Verstärkungslernen für breitere Fähigkeiten.
- Strong-to-Weak-Destillation:
- Die großen Frontier-Modelle (z. B. Qwen3-235B und Qwen3-32B) werden dann als Lehrermodelle verwendet, um das Training von Lightweight Models wie Qwen3-4B zu leiten.
- Dieser Destillationsprozess stellt sicher, dass die kleineren Modelle das Wissen und die Leistung der größeren Modelle behalten, während Größe und Rechenanforderungen erheblich reduziert werden.
- Qwen3-4B:
- Als Ergebnis dieses Destillationsprozesses sind Qwen 3 0.6B,1.7B,4B eine leichte Version, die vom Wissen der größeren Modelle profitiert und gleichzeitig für Effizienz optimiert ist.
Wie greife ich über die Novita-API auf Qwen 3 Small Models zu?
Schritt 1: Anmelden und auf die Modellbibliothek zugreifen
Melden Sie sich in Ihrem Konto an und klicken Sie auf die Schaltfläche Modellbibliothek.

Schritt 2: Wählen Sie Ihr Modell
Durchsuchen Sie die verfügbaren Optionen und wählen Sie das Modell aus, das Ihren Anforderungen entspricht.

Schritt 3: Starten Sie Ihre kostenlose Testversion
Beginnen Sie Ihre kostenlose Testversion, um die Funktionen des ausgewählten Modells zu erkunden.

Schritt 4: Holen Sie sich Ihren API-Schlüssel
Um sich bei der API zu authentifizieren, erhalten Sie einen neuen API-Schlüssel. Gehen Sie auf die Seite „Einstellungen“ und kopieren Sie den API-Schlüssel wie im Bild dargestellt.

Schritt 5: Installieren Sie die API
Installieren Sie die API mit dem für Ihre Programmiersprache spezifischen Paketmanager.

Nach der Installation importieren Sie die erforderlichen Bibliotheken in Ihre Entwicklungsumgebung. Initialisieren Sie die API mit Ihrem API-Schlüssel, um mit Novita AI LLM zu interagieren. Dies ist ein Beispiel für die Verwendung der Chat-Completions-API für Python-Benutzer.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "qwen3-0.6b-fp8"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Qwen3 bietet unvergleichliche Vielseitigkeit mit seinen hybriden Denkmodi, mehrsprachigen Fähigkeiten und leichter Effizienz. Egal, ob Sie komplexe Probleme lösen oder globale Anwendungen entwickeln, Qwen3 befähigt Sie, mehr zu erreichen. Starten Sie noch heute Ihre Reise mit dem kostenlosen Zugang von Novita AI und entdecken Sie die Zukunft der KI-gestützten Entwicklung.
Häufig gestellte Fragen
Was sind die besonderen Merkmale von Qwen3?
Hybride Denkmodi, mehrsprachige Unterstützung, leichte Effizienz (0.6B-, 1.7B-, 4B-Modelle) und verbesserte Codierungsfähigkeiten.
Wie greife ich auf Qwen3-Modelle zu?
Melden Sie sich bei Novita AI an, wählen Sie ein Modell aus, holen Sie sich Ihren API-Schlüssel und integrieren Sie es mit der bereitgestellten Dokumentation in Ihr Projekt.
Sind Qwen3-Modelle kostenlos nutzbar?
Ja! Novita AI bietet kostenlosen Zugang zu Qwen3-Modellen mit einfacher API-Integration.
Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle mit einer einfachen API bereitzustellen, und gleichzeitig eine erschwingliche und zuverlässige GPU-Cloud zum Aufbau und zur Skalierung bereitstellt.

