Como Acessar o Gemma-3-12B-IT de 3 Maneiras?

Como Acessar o Gemma-3-12B-IT de 3 Maneiras?

O Gemma-3-12B-IT pertence à família de modelos abertos Gemma do Google e oferece um desempenho multimodal robusto, mantendo-se leve e eficiente. Construído sobre a mesma base avançada do Gemini, ele lida com tarefas como geração de texto, sumarização, raciocínio e compreensão de imagens com facilidade, oferecendo uma opção poderosa e acessível para desenvolvedores e pesquisadores.

Neste guia, começaremos com uma revisão rápida do Gemma-3-12B-IT e depois percorreremos as diferentes formas de acessá-lo, incluindo interfaces web, integração via API e implantação local.

Inicie seu Teste Gratuito com o Gemma 3 12B IT

O que é o Gemma-3-12B-IT?

Informações Básicas

Característica Detalhes
Tamanho do Modelo 12 Bilhões de Parâmetros
Arquitetura Denso
Código Aberto Sim
Janela de Contexto 128K Tokens
Suporte Multilíngue Destaca-se em inglês, suporta 140 idiomas
Multimodalidade Texto e Imagens (normalizadas para resolução de 896 x 896)
Licença Gemma
Benchmark Desempenho
GPQA Diamond 35%
MMLU-Pro 60%
IFBench 37%
SciCode 17%
LiveCodeBench 14%
AIME 2025 18%
Humanity’s Last Exam 4,8%
AA-LCR 7%

Processamento de Contexto Estendido

Com uma janela de contexto de 128 mil tokens, o Gemma-3-12B-IT vai além de uma mera atualização técnica, pois redefine como as organizações processam documentos longos e fluxos de trabalho analíticos complexos. Seu design avançado elimina os problemas de fragmentação encontrados em modelos convencionais, permitindo uma compreensão perfeita de grandes volumes de texto sem perder coerência ou contexto.

Essa capacidade expandida abre novas fronteiras para a inteligência de documentos, permitindo que sistemas de IA mantenham a compreensão ao longo de artigos de pesquisa completos, contratos ou manuais técnicos, além de interpretar componentes visuais como gráficos, tabelas e ilustrações.

Integração Multimodal Avançada

Construído com uma estrutura de visão e linguagem, o Gemma-3-12B-IT vai muito além do reconhecimento de imagens padrão para alcançar um raciocínio analítico semelhante ao humano. Ao vincular informações textuais e visuais, ele pode interpretar relações entre as duas modalidades e extrair insights mais profundos que seriam inacessíveis por meio de análise apenas textual ou apenas de imagem.

Principais Destaques

  • Análise de Documentos: Extraia insights úteis de relatórios que incluem gráficos, tabelas e elementos visuais.
  • Compreensão Visual: Responda a perguntas complexas baseadas em imagens com raciocínio claro e lógico.
  • Geração de Conteúdo: Escreva descrições, legendas e explicações claras que conectam elementos visuais e texto de forma natural.
  • Suporte ao Aprendizado: Ofereça explicações completas e fáceis de entender que combinam texto com exemplos visuais úteis.

Arquitetura Ajustada por Instrução

O design refinado de ajuste por instrução do Gemma-3-12B-IT agiliza o processo de implantação de IA, minimizando a necessidade de engenharia de prompts complexa ou configuração técnica avançada. Ele interpreta naturalmente comandos de linguagem humana e preserva o contexto por meio de conversas estendidas e multissetoriais, permitindo uma interação mais suave e intuitiva com o modelo.

Como Acessar o Gemma-3-12B-IT: Interface Web (para Iniciantes)

Interface Web do Gemma3 12B IT na Novita AI

Experimente o Gemma 3 12B IT Gratuitamente Agora

Como Acessar o Gemma-3-12B-IT: Usando a API (para Desenvolvedores)

A Novita AI fornece a API do Gemma-3-12B-IT com 131K de contexto, e custos de $0,05/entrada e $0,1/saída, permitindo que desenvolvedores acessem perfeitamente o modelo multimodal leve do Google para tarefas avançadas de raciocínio, sumarização e geração por meio de uma API unificada.

Novita AI

Passo 1: Faça Login e Acesse a Biblioteca de Modelos

Faça login na sua conta e clique no botão Biblioteca de Modelos.

Faça Login e Acesse a Biblioteca de Modelos

Experimente a Demonstração do Gemma 3 12B IT Agora!

Passo 2: Inicie seu Teste Gratuito

Selecione seu modelo e inicie seu teste gratuito para explorar as capacidades do modelo selecionado.

Área de Testes do Gemma3-12b-it

Passo 3: Obtenha sua Chave de API

Para autenticar com a API, forneceremos uma nova chave de API para você. Acessando a página de “Configurações“, você pode copiar a chave de API conforme indicado na imagem.

Obtenha sua Chave de API

Passo 4: Instale a API

Instale a API usando o gerenciador de pacotes específico da sua linguagem de programação.

Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o LLM da Novita AI. Este é um exemplo de uso da API de conclusões de chat para usuários de Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key="session_Um3Ozta39g2J__yeP9b_rOegzeA_qSYYquKzJS2oitKENIo8_H2FL2sCtl25-sKWjCY_wsmN18iuDp1zv_Xkaw==",
)

model = "google/gemma-3-12b-it"
stream = True # or False
max_tokens = 4096
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Opção 2: Fluxos de Trabalho Multiagente com o OpenAI Agents SDK

Construa sistemas multiagente sofisticados aproveitando as capacidades de modo duplo do Gemma-3-12B-IT:

  • Integração Plug-and-Play: Use o DeepSeek V3.1 em qualquer fluxo de trabalho do OpenAI Agents
  • Capacidades Avançadas de Agente: Suporte a transferências, roteamento e integração de ferramentas
  • Arquitetura Escalável: Projete agentes que aproveitem as capacidades do DeepSeek V3.1

Como Acessar o Gemma-3-12B-IT: Implantação Local (para Usuários Avançados)

Requisitos de Hardware para o Gemma3-12B-IT

Quantização Apenas Pesos (Aprox.) Com Cache KV (Aprox.) Configuração Mínima GPU Recomendada
BF16 24,0 GB 38,9 GB Nvidia L40S ×1 Nvidia H100 ×1
SFP8 12,4 GB 27,3 GB Nvidia L40S ×1 Nvidia A100 ×1
INT4 6,6 GB 21,5 GB Nvidia L4 ×1 Nvidia L40S ×1

Para usuários que buscam maior controle e flexibilidade, a Novita AI fornece instâncias de GPU em nuvem sob demanda, incluindo L40S, A100, H100, além de outras opções de alto desempenho, como RTX 4090, RTX 5090 e RTX 6000 Ada, permitindo que os usuários implantem cargas de trabalho de alto desempenho sem esforço, sem depender de hardware local.

Implante na Novita AI

Lista de GPUs 1 na Novita AI

Lista de GPUs 2 na Novita AI

Melhores Práticas para Usar o Gemma-3-12B-IT

  • Escolha o Método de Acesso Correto: Iniciantes podem começar com a interface web para testes rápidos, enquanto desenvolvedores devem usar a API da Novita AI para integração em aplicativos e fluxos de trabalho. Usuários avançados podem preferir a implantação local para controle total e uso offline.
  • Atenha-se aos Requisitos de Recursos: Se for implantar localmente, confira se sua GPU atende à configuração mínima – modelos quantizados como INT4 ou SFP8 são ideais para equilibrar desempenho e eficiência de memória.
  • Otimize para Contexto e Throughput: O Gemma-3-12B-IT suporta até 128K tokens. Para entradas mais longas, divida o conteúdo em segmentos estruturados ou use sumarização para manter resultados coerentes.
  • Aproveite os Pontos Fortes Multimodais: Combine texto e imagens nos prompts para explorar as capacidades de raciocínio analítico e geração descritiva do modelo.
  • Experimente e Itere: Ajuste parâmetros como temperature, top_p e max_tokens para ajustar a criatividade, a factualidade e o comprimento da resposta de acordo com a sua tarefa.

Perguntas Frequentes

O que é o Gemma-3-12B-IT?

O Gemma-3-12B-IT é um modelo multimodal ajustado por instrução da série Gemma do Google, capaz de lidar com entradas de texto e imagem para gerar saídas de texto naturais e cientes do contexto.

Como o Gemma-3-12B-IT é diferente dos outros modelos Gemma?

Ele oferece uma combinação equilibrada de desempenho e eficiência, com 12 bilhões de parâmetros otimizados para tarefas de raciocínio, sumarização e compreensão visual.

Como posso começar a usar o Gemma-3-12B-IT?

Você pode acessá-lo por meio da interface web oficial, da API ou instâncias de GPU da Novita AI, ou por implantação local usando o Hugging Face. A Novita AI oferece preços acessíveis e desempenho robusto.

Novita AI é uma plataforma de nuvem de IA líder que fornece aos desenvolvedores APIs fáceis de usar e infraestrutura de GPU acessível e confiável para construir e escalar aplicativos de IA.