Modelos Llama 3.2 agora disponíveis na Novita AI

Modelos Llama 3.2 agora disponíveis na Novita AI

Experimente a próxima geração do desenvolvimento de IA com a mais recente integração dos modelos Llama 3.2 da Meta pela Novita AI. Nossa plataforma agora oferece um conjunto abrangente de modelos projetados para atender a diversas necessidades de desenvolvimento, mantendo a relação custo-benefício e o desempenho superior.

O que há de novo com o Llama 3.2

|||||||

|---|---|---|---|---|---| ||Llama 2.0 (7B, 13B, 70B)|Llama 3.0 (8B, 70B)|Llama 3.1 (8B, 70B, 405B)|Llama 3.2 Multimodal (11B & 90B)|Llama 3.2 Texto Leve (1B & 3B)| |Data de Lançamento|18 de julho de 2023|18 de abril de 2024|23 de julho de 2024|25 de setembro de 2024|25 de setembro de 2024| |Janela de Contexto|4K|8K|128K|128K|128K| |Tamanho do Vocabulário|32K|128K|128K|128K|128K| |Multilíngue Oficial|Inglês Apenas|Inglês Apenas|8 Idiomas|8 Idiomas|8 Idiomas| |Chamada de Ferramentas|Não|Não|Sim|Sim|Sim| |Corte de Conhecimento|Setembro de 2022|2023, Março (8B) Dezembro (70B)|Dezembro de 2023|Dezembro de 2023|Dezembro de 2023|

1) Entrada Multimodal nos Modelos 11B e 90B

Ilustração da abordagem composicional para adicionar capacidades multimodais ao Llama 3

Fonte: Meta

  • Compreensão de Imagens: Reconhece objetos, cenas e desenhos, além de capacidades de OCR.
  • Legendagem e QA: Gera legendas e responde perguntas com base em conteúdo visual.
  • Raciocínio Visual: Analisa equações, gráficos e documentos para raciocínio visual aprimorado.

2) Tamanhos Menores nos Modelos de Texto Apenas 1B e 3B

  • Novos Casos de Uso de SLM (Small Language Model):
    • Sumarização em dispositivo
    • Escrita e tradução
    • QA em vários idiomas

Modelos Llama 3.2 Disponíveis na Novita AI

Captura de tela do modelo Llama 3.2 na Novita AI

A Novita AI oferece com orgulho três variantes poderosas do Llama 3.2, cada uma otimizada para diferentes casos de uso:

Llama 3.2 1B Instruct: Seu Portal para IA Eficiente

Transforme seu fluxo de trabalho de desenvolvimento com nosso modelo mais acessível, apresentando uma impressionante janela de contexto de 131.000 tokens. Com apenas $0,02/M tokens, este modelo oferece valor excepcional para prototipagem rápida e aplicações leves. Experimente o Llama 3.2 1B Instruct Agora

Llama 3.2 3B Instruct: Potência Encontra Desempenho

Desbloqueie capacidades de raciocínio aprimoradas com nosso modelo intermediário, oferecendo comprimento de contexto de 32.768 tokens. Com preços competitivos de $0,03/M tokens de entrada e $0,05/M tokens de saída, está perfeitamente posicionado para aplicações de médio porte que exigem desempenho robusto. Experimente o Llama 3.2 3B Instruct Agora

Llama 3.2 11B Vision Instruct: Excelência Multimodal

Experimente o processamento multimodal de ponta com nosso modelo de visão avançado. Suportando comprimento de contexto de 131.000 tokens a $0,06/M tokens, ele se destaca em tarefas complexas de linguagem visual. Experimente o Llama 3.2 11B Vision Instruct Agora

Avançando a IA Multimodal com uma Base Open Source

Aplicação do modelo Llama 3.2

Os modelos de visão Llama 3.2, com 11 bilhões e 90 bilhões de parâmetros, fornecem capacidades multimodais robustas para processamento de imagens e texto. Quando integrados à Plataforma Novita AI, essa combinação pode desbloquear aplicações reais significativas, como:

Casos de Uso Multimodais

  • Agentes Interativos: Desenvolva agentes de IA capazes de responder a entradas de texto e imagem, oferecendo uma experiência de usuário aprimorada.
  • Legendagem de Imagens: Crie descrições de imagens de alta qualidade para uso em e-commerce, criação de conteúdo e acessibilidade digital.
  • Pesquisa Visual: Permita que os usuários realizem pesquisas usando imagens, melhorando a eficiência das buscas em ambientes de e-commerce e varejo.
  • Inteligência de Documentos: Analise documentos contendo texto e recursos visuais, como contratos legais e relatórios financeiros.

Aplicações Específicas do Setor

Os endpoints Llama 3.2 da Novita AI abrem novas possibilidades em vários setores:

  • Saúde: Aprimore a análise de imagens médicas para melhorar a precisão diagnóstica e o cuidado com o paciente.
  • Varejo e E-Commerce: Transforme experiências de compra com pesquisas baseadas em imagem e texto e recomendações personalizadas.
  • Finanças e Jurídico: Otimize fluxos de trabalho analisando conteúdo gráfico e textual, aperfeiçoando revisões de contratos e auditorias.
  • Educação e Treinamento: Desenvolva ferramentas educacionais interativas que processam texto e recursos visuais para aumentar o engajamento.

Primeiros Passos: Sua Jornada com a Novita AI

Passo 1: Selecione seu Modelo

Playground do Llama 3.2 1B

Escolha com base em seus requisitos específicos:

Ou use nosso SDK Python para integrar rapidamente os modelos Llama em suas aplicações:

Passo 2: Integre e Implante

Siga nosso processo de integração direto:

  1. Cadastre-se em uma conta Novita AI.
  2. Acesse nossa documentação abrangente da API LLM.
  3. Implemente as chamadas de API em sua linguagem de programação preferida.
  4. Teste minuciosamente em seu ambiente de desenvolvimento.

Exemplo com Python Client

from openai import OpenAI

client = OpenAI(base_url="https://api.novita.ai/v3/openai",api_key="Sua Chave de API",
)

model = "meta-llama/llama-3.2-11b-vision-instruct"stream = True  # ou Falsemax_tokens = 65500system_content = "Seja um assistente útil"temperature = 1top_p = 1min_p = 0top_k = 50presence_penalty = 0frequency_penalty = 0repetition_penalty = 1response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(model=model,messages=[
        {"role": "system","content": system_content,
        },
        {"role": "user","content": "Olá!",
        }
    ],stream=stream,max_tokens=max_tokens,temperature=temperature,top_p=top_p,presence_penalty=presence_penalty,frequency_penalty=frequency_penalty,response_format=response_format,extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
)
if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Exemplo com JavaScript Client

import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.novita.ai/v3/openai",
  apiKey: "Sua Chave de API",
});
const stream = true; // ou false

async function run() {
  const completion = await openai.chat.completions.create({
    messages: [
      {
        role: "system",
        content: "Seja um assistente útil",
      },
      {
        role: "user",
        content: "Olá!",
      },
    ],
    model: "meta-llama/llama-3.2-3b-instruct",
    stream,
    response_format: { type: "text" },
    max_tokens: 16384,
    temperature: 1,
    top_p: 1,
    min_p: 0,
    top_k: 50,
    presence_penalty: 0,
    frequency_penalty: 0,
    repetition_penalty: 1
  });

  if (stream) {
    for await (const chunk of completion) {
      if (chunk.choices[0].finish_reason) {
        console.log(chunk.choices[0].finish_reason);
      } else {
        console.log(chunk.choices[0].delta.content);
      }
    }
  } else {
    console.log(JSON.stringify(completion));
  }
}

run();
  

Exemplo com Curl Client

curl "https://api.novita.ai/v3/openai/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer Sua Chave de API" \
  -d @- << 'EOF'
{
    "model": "meta-llama/llama-3.2-3b-instruct",
    "messages": [
        {
            "role": "system",
            "content": "Seja um assistente útil"
        },
        {
            "role": "user",
            "content": "Olá!"
        }
    ],
    "response_format": { "type": "text" },
    "max_tokens": 16384,
    "temperature": 1,
    "top_p": 1,
    "min_p": 0,
    "top_k": 50,
    "presence_penalty": 0,
    "frequency_penalty": 0,
    "repetition_penalty": 1
}
EOF
  

Passo 3: Otimize e Escalone

Maximize sua implementação:

  • Monitore o uso de tokens e custos.
  • Refine seus prompts para maior eficiência.
  • Escalone sua aplicação com base nas necessidades de desempenho.
  • Utilize as amplas capacidades de comprimento de contexto.

Pronto para Transformar seu Desenvolvimento de IA?

Visite Novita AI hoje para começar a construir com o Llama 3.2. Nossa equipe está pronta para apoiar sua jornada, desde a experimentação até a implantação em produção, garantindo que você aproveite ao máximo esses modelos poderosos.

Publicado originalmente em Novita AI

Novita AI é a plataforma all-in-one na nuvem que impulsiona suas ambições de IA. APIs integradas, serverless, instância GPU — as ferramentas custo-efetivas que você precisa. Elimine infraestrutura, comece gratuitamente e torne sua visão de IA realidade.

Leitura Recomendada

  1. Llama 3.2 vs GPT-4o: Escolhendo o Modelo de IA Certo
  2. Como Acessar o Llama 3.2: Simplificando seu Processo de Desenvolvimento de IA
  3. Llama 3.2 Vision: Liberando o Poder da IA Open Source Multimodal