So greifen Sie auf Gemma-3-12B-IT auf 3 Arten zu?

So greifen Sie auf Gemma-3-12B-IT auf 3 Arten zu?

Gemma-3-12B-IT gehört zur Familie der offenen Gemma-Modelle von Google und bietet starke multimodale Leistung bei gleichzeitig geringem Gewicht und hoher Effizienz. Es basiert auf der gleichen fortschrittlichen Grundlage wie Gemini und bewältigt Aufgaben wie Textgenerierung, Zusammenfassung, Schlussfolgerung und Bildverständnis mit Leichtigkeit, was es zu einer leistungsstarken und gleichzeitig zugänglichen Option für Entwickler und Forscher gleichermaßen macht.

In diesem Leitfaden geben wir zunächst einen kurzen Überblick über Gemma-3-12B-IT und gehen dann auf verschiedene Zugriffsmöglichkeiten ein, darunter Weboberflächen, API-Integration und lokale Bereitstellung.

Starten Sie Ihre kostenlose Testversion mit Gemma 3 12B IT

Was ist Gemma-3-12B-IT?

Grundlegende Informationen

Funktion Details
Modellgröße 12B Parameter
Architektur Dense
Open Source Ja
Kontextfenster 128K Token
Mehrsprachige Unterstützung Glänzt in Englisch, unterstützt 140 Sprachen
Multimodalität Text und Bilder (normalisiert auf eine Auflösung von 896 x 896)
Lizenz Gemma
Benchmark Leistung
GPQA Diamond 35%
MMLU-Pro 60%
IFBench 37%
SciCode 17%
LiveCodeBench 14%
AIME 2025 18%
Humanity’s Last Exam 4.8%
AA-LCR 7%

Erweiterte Kontextverarbeitung

Mit einem Kontextfenster von 128.000 Token geht Gemma-3-12B-IT über ein einfaches technisches Upgrade hinaus, da es neu definiert, wie Organisationen lange Dokumente und komplexe analytische Workflows verarbeiten. Sein fortschrittliches Design beseitigt die Fragmentierungsprobleme, die bei herkömmlichen Modellen auftreten, und ermöglicht ein nahtloses Verständnis großer Textmengen, ohne Kohärenz oder Kontext zu verlieren.

Diese erweiterte Kapazität eröffnet neue Horizonte für die Dokumentenintelligenz: KI-Systeme können ihr Verständnis über gesamte Forschungsarbeiten, Verträge oder technische Handbücher hinweg beibehalten und gleichzeitig visuelle Komponenten wie Grafiken, Diagramme und Illustrationen interpretieren.

Erweiterte multimodale Integration

Mit einem Vision-Language-Framework ausgestattet, geht Gemma-3-12B-IT weit über die Standard-Bilderkennung hinaus, um eine dem Menschen ähnliche analytische Schlussfolgerung zu erreichen. Durch Verknüpfung von Text- und Bildinformationen kann es Beziehungen zwischen den beiden Modalitäten interpretieren und tiefere Erkenntnisse extrahieren, die durch reine Text- oder Bildanalyse unzugänglich wären.

Wichtige Highlights

  • Dokumentenanalyse: Extrahieren Sie nützliche Erkenntnisse aus Berichten, die Diagramme, Grafiken und visuelle Elemente enthalten.
  • Visuelles Verständnis: Beantworten Sie komplexe, bildbasierte Fragen mit klarer und logischer Schlussfolgerung.
  • Inhaltsgenerierung: Verfassen Sie klare Beschreibungen, Bildunterschriften und Erklärungen, die visuelle und textuelle Inhalte natürlich verbinden.
  • Lernunterstützung: Bieten Sie gründliche, leicht verständliche Erklärungen, die Text mit hilfreichen visuellen Beispielen kombinieren.

Instruction-Tuned-Architektur

Das verfeinerte Instruction-Tuning-Design von Gemma-3-12B-IT optimiert den KI-Bereitstellungsprozess, indem es den Bedarf an komplexem Prompt-Engineering oder fortgeschrittener technischer Einrichtung minimiert. Es interpretiert natürlich menschliche Sprachbefehle und behält den Kontext über erweiterte, mehrgängige Gespräche hinweg bei, was eine reibungslosere und intuitivere Interaktion mit dem Modell ermöglicht.

So greifen Sie auf Gemma-3-12B-IT zu: Weboberfläche (für Einsteiger)

Gemma3 12B IT Weboberfläche auf Novita AI

Testen Sie Gemma 3 12B IT jetzt kostenlos

So greifen Sie auf Gemma-3-12B-IT zu: Über die API (für Entwickler)

Novita AI bietet die Gemma-3-12B-IT-API mit 131K Kontext zu Kosten von $0.05/Eingabe und $0.1/Ausgabe, sodass Entwickler nahtlos auf Googles leichtgewichtiges multimodales Modell für fortgeschrittene Schlussfolgerungs-, Zusammenfassungs- und Generierungsaufgaben über eine einheitliche API zugreifen können.

Novita AI

Schritt 1: Anmelden und auf die Modellbibliothek zugreifen

Melden Sie sich bei Ihrem Konto an und klicken Sie auf die Schaltfläche Modellbibliothek.

Anmelden und auf die Modellbibliothek zugreifen

Testen Sie die Gemma 3 12B IT Demo jetzt!

Schritt 2: Starten Sie Ihre kostenlose Testversion

Wählen Sie Ihr Modell aus und beginnen Sie Ihre kostenlose Testversion, um die Funktionen des ausgewählten Modells zu erkunden.

Gemma3-12b-it Testumgebung

Schritt 3: Holen Sie sich Ihren API-Schlüssel

Um sich gegenüber der API zu authentifizieren, stellen wir Ihnen einen neuen API-Schlüssel zur Verfügung. Gehen Sie auf die Seite „Einstellungen“, dort können Sie den API-Schlüssel wie in der Abbildung gezeigt kopieren.

API-Schlüssel abrufen

Schritt 4: Installieren Sie die API

Installieren Sie die API über den für Ihre Programmiersprache spezifischen Paketmanager. Nach der Installation importieren Sie die erforderlichen Bibliotheken in Ihre Entwicklungsumgebung. Initialisieren Sie die API mit Ihrem API-Schlüssel, um mit der Novita AI LLM zu interagieren. Dies ist ein Beispiel für die Verwendung der Chat-Completions-API für Python-Nutzer.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key="session_Um3Ozta39g2J__yeP9b_rOegzeA_qSYYquKzJS2oitKENIo8_H2FL2sCtl25-sKWjCY_wsmN18iuDp1zv_Xkaw==",
)

model = "google/gemma-3-12b-it"
stream = True # or False
max_tokens = 4096
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Option 2: Multi-Agent-Workflows mit dem OpenAI Agents SDK

Erstellen Sie anspruchsvolle Multi-Agent-Systeme unter Nutzung der Dual-Mode-Fähigkeiten von Gemma-3-12B-IT:

  • Plug-and-Play-Integration: Nutzen Sie DeepSeek V3.1 in jedem OpenAI Agents-Workflow
  • Erweiterte Agent-Funktionen: Unterstützung für Übergaben, Routing und Tool-Integration
  • Skalierbare Architektur: Entwerfen Sie Agenten, die die Fähigkeiten von DeepSeek V3.1 nutzen

So greifen Sie auf Gemma-3-12B-IT zu: Lokale Bereitstellung (für fortgeschrittene Benutzer)

Hardwareanforderungen für Gemma3-12B-IT

Quantisierung Nur Gewichte (ca.) Mit KV-Cache (ca.) Minimale Konfiguration Empfohlene GPU
BF16 24,0 GB 38,9 GB Nvidia L40S ×1 Nvidia H100 ×1
SFP8 12,4 GB 27,3 GB Nvidia L40S ×1 Nvidia A100 ×1
INT4 6,6 GB 21,5 GB Nvidia L4 ×1 Nvidia L40S ×1

Für Benutzer, die mehr Kontrolle und Flexibilität wünschen, bietet Novita AI On-Demand-Cloud-GPU-Instanzen einschließlich L40S, A100, H100 sowie weitere anspruchsvolle Optionen wie RTX 4090, RTX 5090 und RTX 6000 Ada, sodass Benutzer hochleistungsfähige Workloads mühelos bereitstellen können, ohne auf lokale Hardware angewiesen zu sein.

Auf Novita AI bereitstellen

GPU-Liste 1 auf Novita AI

GPU-Liste 2 auf Novita AI

Best Practices für die Nutzung von Gemma-3-12B-IT

  • Wählen Sie die richtige Zugriffsmethode: Einsteiger können mit der Weboberfläche für schnelle Tests beginnen, während Entwickler die Novita AI API für die Integration in Apps und Workflows nutzen sollten. Fortgeschrittene Benutzer bevorzugen möglicherweise die lokale Bereitstellung für volle Kontrolle und Offline-Nutzung.
  • Beachten Sie die Ressourcenanforderungen: Wenn Sie lokal bereitstellen, stellen Sie sicher, dass Ihre GPU die minimale Konfiguration erfüllt – quantisierte Modelle wie INT4 oder SFP8 eignen sich ideal, um Leistung und Speichereffizienz auszugleichen.
  • Optimieren Sie für Kontext und Durchsatz: Gemma-3-12B-IT unterstützt bis zu 128K Token. Teilen Sie bei längeren Eingaben den Inhalt in strukturierte Segmente auf oder verwenden Sie Zusammenfassung, um kohärente Ergebnisse zu gewährleisten.
  • Nutzen Sie die multimodalen Stärken: Kombinieren Sie Text und Bilder in Prompts, um die analytischen Schlussfolgerungs- und beschreibenden Generierungsfähigkeiten des Modells zu erkunden.
  • Experimentieren und iterieren: Passen Sie Parameter wie temperature, top_p und max_tokens an, um Kreativität, Faktizität und Antwortlänge entsprechend Ihrer Aufgabe fein abzustimmen.

Häufig gestellte Fragen

Was ist Gemma-3-12B-IT?

Gemma-3-12B-IT ist ein instruction-tuned, multimodales Modell aus der Gemma-Serie von Google, das sowohl Text- als auch Bildeingaben verarbeiten kann, um natürliche, kontextbewusste Textausgaben zu generieren.

Wie unterscheidet sich Gemma-3-12B-IT von anderen Gemma-Modellen?

Es bietet eine ausgewogene Kombination aus Leistung und Effizienz, mit 12 Milliarden Parametern, die für Schlussfolgerungs-, Zusammenfassungs- und visuelle Verständnisaufgaben optimiert sind.

Wie kann ich mit Gemma-3-12B-IT starten?

Sie können es über die offizielle Weboberfläche, die Novita AI API oder GPU-Instanzen oder die lokale Bereitstellung über Hugging Face nutzen. Novita AI bietet erschwingliche Preise und robuste Leistung.

Novita AI ist eine führende KI-Cloud-Plattform, die Entwicklern benutzerfreundliche APIs und erschwingliche, zuverlässige GPU-Infrastruktur für die Entwicklung und Skalierung von KI-Anwendungen bereitstellt.