Qwen 3 235B A22B ohne Ihre GPU zu schmelzen: 3 einfache API-Methoden

Inhaltsverzeichnis

Was ist Qwen 3 235B A22B?
Option 1: Direkte API-Integration
Option 2: Multi-Agent-Workflows mit OpenAI Agents SDK
Option 3: Qwen 3 API-Integration von Drittanbietern

Wichtige Highlights

Qwen 3 235B A22B ist ein leistungsstarkes Mixture-of-Experts (MoE)-Modell, das für fortgeschrittenes Reasoning, Coding und mehrsprachige Aufgaben entwickelt wurde.

Der lokale Betrieb erfordert ~1128 GB VRAM – das entspricht 16× A100 oder 16× H100 GPUs – und ist daher für die meisten einzelnen Entwickler unzugänglich.

So greifen Sie per API auf Qwen 3 235B A22B zu: 3 einfache Methoden:

Direkte API-Integration mit OpenAI-kompatiblen Endpunkten
Multi-Agent-Workflows mit OpenAI Agents SDK
Drittanbieter-Integrationen über Hugging Face, LangChain, Dify und mehr

Qwen 3 235B A22B ist eines der leistungsfähigsten großen Sprachmodelle, die heute verfügbar sind, mit Spitzenleistungen in Reasoning, Mathematik und mehrsprachigen Aufgaben. Da der VRAM-Bedarf jedoch über 1 TB beträgt, ist der lokale Betrieb für die meisten Entwickler nahezu unmöglich. Glücklicherweise ermöglicht der API-basierte Zugriff, diese Leistung ohne die schwere Infrastruktur zu nutzen.

Was ist Qwen 3 235B A22B?

Qwen 3 235B A22B Benchmark

Von Qwen

Hardware-Anforderungen von Qwen 3 235B A22B

Der lokale Betrieb von Qwen 3 235B A22B erfordert ~1128 GB VRAM, was Folgendem entspricht:

16× A100 (80 GB) GPUs
oder 16× H100 (80 GB) GPUs

Diese Konfiguration liegt weit außerhalb der Reichweite der meisten einzelnen Entwickler oder kleinen Teams.

Die API ist die intelligentere Wahl für die meisten Entwickler

Keine Einrichtungs- oder Hardwarekosten
Sofortiger Zugriff auf hochmoderne Modelle
Skalierbare Nutzung je nach Bedarf
Kontinuierliche Modellaktualisierungen und -wartung

Option 1: Direkte API-Integration

Schritt 1: Anmelden und auf die Modellbibliothek zugreifen

Melden Sie sich in Ihrem Konto an und klicken Sie auf die Schaltfläche Model Library.

Schritt 2: Wählen Sie Ihr Modell

Durchsuchen Sie die verfügbaren Optionen und wählen Sie das Modell aus, das Ihren Anforderungen entspricht.

Schritt 3: Starten Sie Ihre kostenlose Testversion

Beginnen Sie Ihre kostenlose Testversion, um die Fähigkeiten des ausgewählten Modells zu erkunden.

Testen Sie Qwen 3 235B A22B jetzt!

Schritt 4: Holen Sie sich Ihren API-Schlüssel

Zur Authentifizierung mit der API stellen wir Ihnen einen neuen API-Schlüssel zur Verfügung. Rufen Sie die Seite „Settings“ auf und kopieren Sie den API-Schlüssel, wie im Bild gezeigt.

Schritt 5: Installieren Sie die API

Installieren Sie die API mit dem für Ihre Programmiersprache spezifischen Paketmanager.

Importieren Sie nach der Installation die erforderlichen Bibliotheken in Ihre Entwicklungsumgebung. Initialisieren Sie die API mit Ihrem API-Schlüssel, um mit Novita AI LLM zu interagieren. Dies ist ein Beispiel für die Verwendung der Chat Completions API für Python-Benutzer.

from openai import OpenAI
  
from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "qwen/qwen3-235b-a22b-fp8"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Option 2: Multi-Agent-Workflows mit OpenAI Agents SDK

Das OpenAI Agents SDK ist eine produktionsreife Weiterentwicklung des SWARM-Projekts von OpenAI, die die Entwicklung intelligenter, kollaborativer und sicherer KI-Agenten vereinfachen soll. Im Kern stehen LLM-basierte Agenten, die mit benutzerdefinierten Anweisungen, Rollen und externen Tools konfiguriert werden können. Das SDK bietet leistungsstarke Funktionen wie die automatische Umwandlung von Funktionstools mit Pydantic-Validierung, integrierte Agenten-Schleifen für nahtloses Tool-Feedback, Multi-Agent-Aufgabendelegierung und robuste Sicherheitsvorkehrungen. Entwickler profitieren von Python-nativem Orchestrierung, integrierten Tracing-Tools zum Debuggen und hoher Anpassbarkeit – alles in einem leichten Framework, das eine minimale Einarbeitungszeit erfordert.

1. Richten Sie Ihre Python-Umgebung ein und installieren Sie das Agents SDK.

python -m venv env
source env/bin/activate
pip install openai-agents

2. Richten Sie Ihren Novita-API-Schlüssel ein.

Zur Konsole gehen und 10 Credits erhalten

3. Ein Beispiel für Übergaben (Handoffs)

import os
from openai import AsyncOpenAI
from agents import (
    Agent,
    Runner,
    set_default_openai_api,
    set_default_openai_client,
    set_tracing_disabled,
)

BASE_URL = "https://api.novita.ai/v3/openai"
API_KEY = os.getenv("NOVITA_API_KEY")
MODEL_NAME = os.getenv("MODEL_NAME")

# Because Novita not support the responses API so we use the chat completions API instead.
set_default_openai_api("chat_completions")
set_default_openai_client(AsyncOpenAI(base_url=BASE_URL, api_key=API_KEY))
# Disable tracing for this example
# Refer to https://openai.github.io/openai-agents-python/tracing/#external-tracing-processors-list to use the custom spans.
set_tracing_disabled(disabled=True)

agent = Agent(name="Assistant",
              instructions="You are a helpful assistant", model=MODEL_NAME)

result = Runner.run_sync(
    agent, "Write a haiku about recursion in programming.")
print(result.final_output)

# Code within the code,
# Functions calling themselves,
# Infinite loop's dance.

Option 3: Qwen 3 API-Integration von Drittanbietern

1. HuggingFace-Integration

Schritt 1: API-Schlüssel auf Hugging Face konfigurieren

Rufen Sie Ihr Kontoeinstellungs-Dashboard auf, um Ihre API-Schlüssel zu konfigurieren.
Geben Sie Ihre Novita AI-Authentifizierungsdaten auf der Hugging Face-Plattform ein.

Schritt 2: Wählen Sie Inference-API-Modi

Custom Key Mode: Aufrufe werden direkt an den Inference-Anbieter gesendet und verwenden Ihren eigenen API-Schlüssel.
HF-Routed Mode: In diesem Modus ist kein Anbieter-Token erforderlich. Die Gebühren werden Ihrem Hugging Face-Konto anstelle des Anbieterkontos belastet.

Schritt 3: Klicken Sie auf die Einstellungsschaltfläche und wählen Sie Novita AI als Ihren API-Anbieter aus

2. Agenten/Framework-Integration mit Novita AI

Novita AI ist ein erstklassiger Partner vieler beliebter Agenten-Frameworks.
Sie können Novita direkt als Ihren Anbieter innerhalb der Plattformen auswählen. Jedes kommt mit offiziellen Connectoren und Schritt-für-Schritt-Anleitungen, was die Integration für Multi-Agent-Workflows, Tool-Calling-Agenten und komplexe Orchestrierungsaufgaben reibungslos gestaltet.

Continue
AnythingLLM
LangChain
Dify
Langflow

3. OpenAI-kompatible API-Integration

Für Tools, die auf dem OpenAI API-Standard basieren, bietet Novita AI einen Drop-in-Ersatz – alles, was Sie brauchen, ist eine Basis-URL und einen API-Schlüssel. Diese Methode erfordert kein Refactoring und unterstützt die sofortige Migration für Apps, die bereits OpenAI-kompatible Aufrufe verwenden.

Häufig gestellte Fragen

Was ist Qwen 3 235B A22B?

Ein hochmodernes MoE-Sprachmodell von Alibaba mit 235B Parametern (22B aktiv pro Forward-Pass), das sich durch Logik, Mathematik und mehrsprachige Aufgaben auszeichnet.

Warum kann ich Qwen 3 235B A22B nicht lokal ausführen?

Es erfordert ~1128 GB VRAM – weit über die Hardware von Verbrauchergeräten hinaus. Sie benötigen 16× A100- oder H100-GPUs.

Gibt es eine kostenlose Testversion für Qwen 3 235B A22B?

Ja. Novita AI bietet kostenlose Credits, um das Modell vor einer Verpflichtung zu erkunden.

*Novita AI *ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle mit unserer einfachen API bereitzustellen, und gleichzeitig die erschwingliche und zuverlässige GPU-Cloud zum Erstellen und Skalieren bereitstellt.

Qwen 3 235B A22B ohne Ihre GPU zu schmelzen: 3 einfache API-Methoden

Wichtige Highlights

Was ist Qwen 3 235B A22B?

Qwen 3 235B A22B Benchmark

Hardware-Anforderungen von Qwen 3 235B A22B

Option 1: Direkte API-Integration

Schritt 1: Anmelden und auf die Modellbibliothek zugreifen

Schritt 2: Wählen Sie Ihr Modell

Schritt 3: Starten Sie Ihre kostenlose Testversion

Schritt 4: Holen Sie sich Ihren API-Schlüssel

Schritt 5: Installieren Sie die API

Option 2: Multi-Agent-Workflows mit OpenAI Agents SDK

1. Richten Sie Ihre Python-Umgebung ein und installieren Sie das Agents SDK.

2. Richten Sie Ihren Novita-API-Schlüssel ein.

3. Ein Beispiel für Übergaben (Handoffs)

Option 3: Qwen 3 API-Integration von Drittanbietern

1. HuggingFace-Integration

2. Agenten/Framework-Integration mit Novita AI

3. OpenAI-kompatible API-Integration

Häufig gestellte Fragen

Empfohlene Lektüre

Product

RESOURCES

Partners

Company

Wichtige Highlights

Was ist Qwen 3 235B A22B?

Qwen 3 235B A22B Benchmark

Hardware-Anforderungen von Qwen 3 235B A22B

Option 1: Direkte API-Integration

Schritt 1: Anmelden und auf die Modellbibliothek zugreifen

Schritt 2: Wählen Sie Ihr Modell

Schritt 3: Starten Sie Ihre kostenlose Testversion

Schritt 4: Holen Sie sich Ihren API-Schlüssel

Schritt 5: Installieren Sie die API

Option 2: Multi-Agent-Workflows mit OpenAI Agents SDK

1. Richten Sie Ihre Python-Umgebung ein und installieren Sie das Agents SDK.

2. Richten Sie Ihren Novita-API-Schlüssel ein.

3. Ein Beispiel für Übergaben (Handoffs)

Option 3: Qwen 3 API-Integration von Drittanbietern

1. HuggingFace-Integration

2. Agenten/Framework-Integration mit Novita AI

3. OpenAI-kompatible API-Integration

Häufig gestellte Fragen

Empfohlene Lektüre

Ähnliche Beiträge

Product

RESOURCES

Partners

Company