Experimente a próxima geração do desenvolvimento de IA com a mais recente integração dos modelos Llama 3.2 da Meta pela Novita AI. Nossa plataforma agora oferece um conjunto abrangente de modelos projetados para atender a diversas necessidades de desenvolvimento, mantendo a relação custo-benefício e o desempenho superior.
O que há de novo com o Llama 3.2
|||||||
1) Entrada Multimodal nos Modelos 11B e 90B

Fonte: Meta
- Compreensão de Imagens: Reconhece objetos, cenas e desenhos, além de capacidades de OCR.
- Legendagem e QA: Gera legendas e responde perguntas com base em conteúdo visual.
- Raciocínio Visual: Analisa equações, gráficos e documentos para raciocínio visual aprimorado.
2) Tamanhos Menores nos Modelos de Texto Apenas 1B e 3B
- Novos Casos de Uso de SLM (Small Language Model):
- Sumarização em dispositivo
- Escrita e tradução
- QA em vários idiomas
Modelos Llama 3.2 Disponíveis na Novita AI

A Novita AI oferece com orgulho três variantes poderosas do Llama 3.2, cada uma otimizada para diferentes casos de uso:
Llama 3.2 1B Instruct: Seu Portal para IA Eficiente
Transforme seu fluxo de trabalho de desenvolvimento com nosso modelo mais acessível, apresentando uma impressionante janela de contexto de 131.000 tokens. Com apenas $0,02/M tokens, este modelo oferece valor excepcional para prototipagem rápida e aplicações leves. Experimente o Llama 3.2 1B Instruct Agora
Llama 3.2 3B Instruct: Potência Encontra Desempenho
Desbloqueie capacidades de raciocínio aprimoradas com nosso modelo intermediário, oferecendo comprimento de contexto de 32.768 tokens. Com preços competitivos de $0,03/M tokens de entrada e $0,05/M tokens de saída, está perfeitamente posicionado para aplicações de médio porte que exigem desempenho robusto. Experimente o Llama 3.2 3B Instruct Agora
Llama 3.2 11B Vision Instruct: Excelência Multimodal
Experimente o processamento multimodal de ponta com nosso modelo de visão avançado. Suportando comprimento de contexto de 131.000 tokens a $0,06/M tokens, ele se destaca em tarefas complexas de linguagem visual. Experimente o Llama 3.2 11B Vision Instruct Agora
Avançando a IA Multimodal com uma Base Open Source

Aplicação do modelo Llama 3.2
Os modelos de visão Llama 3.2, com 11 bilhões e 90 bilhões de parâmetros, fornecem capacidades multimodais robustas para processamento de imagens e texto. Quando integrados à Plataforma Novita AI, essa combinação pode desbloquear aplicações reais significativas, como:
Casos de Uso Multimodais
- Agentes Interativos: Desenvolva agentes de IA capazes de responder a entradas de texto e imagem, oferecendo uma experiência de usuário aprimorada.
- Legendagem de Imagens: Crie descrições de imagens de alta qualidade para uso em e-commerce, criação de conteúdo e acessibilidade digital.
- Pesquisa Visual: Permita que os usuários realizem pesquisas usando imagens, melhorando a eficiência das buscas em ambientes de e-commerce e varejo.
- Inteligência de Documentos: Analise documentos contendo texto e recursos visuais, como contratos legais e relatórios financeiros.
Aplicações Específicas do Setor
Os endpoints Llama 3.2 da Novita AI abrem novas possibilidades em vários setores:
- Saúde: Aprimore a análise de imagens médicas para melhorar a precisão diagnóstica e o cuidado com o paciente.
- Varejo e E-Commerce: Transforme experiências de compra com pesquisas baseadas em imagem e texto e recomendações personalizadas.
- Finanças e Jurídico: Otimize fluxos de trabalho analisando conteúdo gráfico e textual, aperfeiçoando revisões de contratos e auditorias.
- Educação e Treinamento: Desenvolva ferramentas educacionais interativas que processam texto e recursos visuais para aumentar o engajamento.
Primeiros Passos: Sua Jornada com a Novita AI
Passo 1: Selecione seu Modelo

Escolha com base em seus requisitos específicos:
- Para prototipagem: Visite nossa Demo do Llama 3.2 1B Instruct para testes iniciais.
- Para aplicações de produção: Experimente o modelo Llama 3.2 3B Instruct para capacidades aprimoradas.
- Para tarefas visuais-linguísticas: Teste os recursos multimodais em nossa Demo do Llama 3.2 11B Vision Instruct.
Ou use nosso SDK Python para integrar rapidamente os modelos Llama em suas aplicações:
Passo 2: Integre e Implante
Siga nosso processo de integração direto:
- Cadastre-se em uma conta Novita AI.
- Acesse nossa documentação abrangente da API LLM.
- Implemente as chamadas de API em sua linguagem de programação preferida.
- Teste minuciosamente em seu ambiente de desenvolvimento.
Exemplo com Python Client
from openai import OpenAI
client = OpenAI(base_url="https://api.novita.ai/v3/openai",api_key="Sua Chave de API",
)
model = "meta-llama/llama-3.2-11b-vision-instruct"stream = True # ou Falsemax_tokens = 65500system_content = "Seja um assistente útil"temperature = 1top_p = 1min_p = 0top_k = 50presence_penalty = 0frequency_penalty = 0repetition_penalty = 1response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(model=model,messages=[
{"role": "system","content": system_content,
},
{"role": "user","content": "Olá!",
}
],stream=stream,max_tokens=max_tokens,temperature=temperature,top_p=top_p,presence_penalty=presence_penalty,frequency_penalty=frequency_penalty,response_format=response_format,extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Exemplo com JavaScript Client
import OpenAI from "openai";
const openai = new OpenAI({
baseURL: "https://api.novita.ai/v3/openai",
apiKey: "Sua Chave de API",
});
const stream = true; // ou false
async function run() {
const completion = await openai.chat.completions.create({
messages: [
{
role: "system",
content: "Seja um assistente útil",
},
{
role: "user",
content: "Olá!",
},
],
model: "meta-llama/llama-3.2-3b-instruct",
stream,
response_format: { type: "text" },
max_tokens: 16384,
temperature: 1,
top_p: 1,
min_p: 0,
top_k: 50,
presence_penalty: 0,
frequency_penalty: 0,
repetition_penalty: 1
});
if (stream) {
for await (const chunk of completion) {
if (chunk.choices[0].finish_reason) {
console.log(chunk.choices[0].finish_reason);
} else {
console.log(chunk.choices[0].delta.content);
}
}
} else {
console.log(JSON.stringify(completion));
}
}
run();
Exemplo com Curl Client
curl "https://api.novita.ai/v3/openai/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer Sua Chave de API" \
-d @- << 'EOF'
{
"model": "meta-llama/llama-3.2-3b-instruct",
"messages": [
{
"role": "system",
"content": "Seja um assistente útil"
},
{
"role": "user",
"content": "Olá!"
}
],
"response_format": { "type": "text" },
"max_tokens": 16384,
"temperature": 1,
"top_p": 1,
"min_p": 0,
"top_k": 50,
"presence_penalty": 0,
"frequency_penalty": 0,
"repetition_penalty": 1
}
EOF
Passo 3: Otimize e Escalone
Maximize sua implementação:
- Monitore o uso de tokens e custos.
- Refine seus prompts para maior eficiência.
- Escalone sua aplicação com base nas necessidades de desempenho.
- Utilize as amplas capacidades de comprimento de contexto.
Pronto para Transformar seu Desenvolvimento de IA?
Visite Novita AI hoje para começar a construir com o Llama 3.2. Nossa equipe está pronta para apoiar sua jornada, desde a experimentação até a implantação em produção, garantindo que você aproveite ao máximo esses modelos poderosos.
Publicado originalmente em Novita AI
Novita AI é a plataforma all-in-one na nuvem que impulsiona suas ambições de IA. APIs integradas, serverless, instância GPU — as ferramentas custo-efetivas que você precisa. Elimine infraestrutura, comece gratuitamente e torne sua visão de IA realidade.
Leitura Recomendada
