Apresentando o Llama3 405B: Lançamentos de LLM Abertamente Disponíveis

Apresentando o Llama3 405B: Lançamentos de LLM Abertamente Disponíveis

Introdução

A Meta lançou seu modelo de linguagem AI mais avançado, o Llama3 405B, e pretende manter seu status de código aberto. A data de lançamento do Llama3 405B é 23 de julho de 2024. Este modelo possui mais de 400 bilhões de parâmetros. Vamos explorar os recursos e aplicações úteis do modelo neste blog.

O que é o Llama3 405B?

Contexto do Lançamento do Llama3 405B

Em abril de 2024, a Meta apresentou o Llama 3, uma nova edição de seus modelos de linguagem grandes impulsionados por AI. Inicialmente oferecido nos tamanhos de 8B e 70B parâmetros, o Llama 3 imediatamente superou o desempenho do Llama 2, Gemma, Gemini e Claude em seu lançamento.

A Meta vem cultivando um ecossistema de AI aberto. Agora, um modelo mais poderoso chamado Llama3 405B foi atualizado com mais de 400 bilhões de parâmetros. Isso marca uma conquista para a comunidade de AI de código aberto, pois um modelo de código aberto tem o potencial de superar o principal modelo de LLM de código fechado atual, como o GPT-4.

Para responder ao seu lançamento, a Novita AI fornecerá serviço de API LLM do Llama3 405B. Também ofereceremos as informações mais recentes no Discord. Fique informado conosco!

Comparação dos Modelos da Família Llama3

A família de modelos Llama3 possui dois de sucesso: Llama3 8B e Llama3 70B. Aqui estão algumas comparações, conforme mostrado no gráfico e no texto, entre eles e o novo modelo Llama 405B.

  • Tamanho de Parâmetros

O Llama3 8B tem 8 bilhões de parâmetros, e o Llama3 70B tem 70 bilhões. No entanto, o Llama3 405B é significativamente maior, com mais de 400 bilhões de parâmetros.

  • Compreensão e Capacidade de Resposta Aprimoradas

O Llama3 405B apresentará compreensão contextual melhorada e respostas mais nuançadas.

  • Capacidade Multilíngue

O Llama3 405B tem desempenho superior em tradução e compreensão cross-linguística.

  • Aprendizado Few-Shot Aprimorado

O recém-lançado Llama3 405 apresenta uma capacidade aprimorada de se adaptar a novas tarefas com exemplos mínimos.

Quais São os Principais Recursos do Llama3 405B

Desempenho em Benchmarks do Llama3 405B

Aqui estão os desempenhos em benchmarks para referência. O Llama3 405B supera o GPT-4o em múltiplos testes, incluindo BoolQ, GSM8K, Hellaswag, MMLU-humanities, MMLU-other, MMLU-stem e Winograd. Esses resultados são baseados no modelo base do Llama3 405B, indicando que ajustes e otimizações adicionais podem liberar maior potencial para o modelo, permitindo que ele alcance desempenhos ainda mais altos nos testes de benchmark posteriormente.

O modelo principal 405B compete com modelos de fundação líderes como GPT-4, GPT-4o e Claude 3.5 Sonnet em várias tarefas, com base na avaliação humana experimental.

Recursos Técnicos

  • Tokens pré-treinados: 15 Trilhões
  • Número de camadas: 118 camadas
  • Tamanho do embedding: 16.384
  • Tamanho do vocabulário: 128.256
  • Comprimento do contexto: Versões com 128 mil tokens de contexto

Vantagens do Código Aberto

  • Custo-benefício

Desenvolvedores, especialmente pequenas empresas e startups de tecnologia, podem implantar esses modelos livremente e podem personalizá-los ainda mais para atender às suas necessidades específicas.

  • Flexibilidade

A flexibilidade de alternar entre modelos abertos e fechados para mitigar riscos associados à dependência de um único tipo de modelo é crucial para as empresas. Com seu recurso aberto, a atualização não está mais limitada a uma única empresa e pode ser amplamente implantada em muitos sistemas diferentes.

  • Segurança de Dados

O modelo aberto reduz o risco de violações de dados e aumenta a privacidade, o que é crucial para proteger dados sensíveis e garantir conformidade regulatória. Além disso, é viável implementar anonimização e criptografia de dados.

O Que Seria Necessário para Executar o Llama3 405B

Fatores de Treinamento

Bibliotecas de treinamento personalizadas e infraestrutura de produção para pré-treinamento, ajuste fino, anotação e avaliação são cruciais na execução.

Capacidade de Computação

Primeiro, os desenvolvedores precisam ter 8GB+ de RAM normal para executar este modelo. Segundo, conhecer o básico do algoritmo é crucial neste processo.

Framework Básico

Usar um framework de API simplifica a integração de um LLM. Suas ferramentas e bibliotecas facilitam o processo de execução para o modelo Llama3 405B. Aproveitar frameworks como Novita AI otimiza a implementação do Llama3 405B para maior eficiência.

Ajuste Fino Supervisionado

Este modelo está pronto para escalar a quantidade de dados de ajuste fino em todas as capacidades. Para geração adicional de dados sintéticos e estrutura de transformador otimizada, esta etapa é crucial.

Aplicações Úteis

Aqui estão algumas aplicações úteis do Llama3 405B para referência.

Raciocínio Complexo sobre Instruções

O Llama3 405B demonstra desempenho impressionante ao lidar com uma variedade de perguntas, incluindo aritmética simples e problemas de raciocínio complexo baseados em instruções.

Uso Multimodal

Este modelo oferece uma base para desenvolvedores criarem conjuntos de dados ricos e sem restrições. Os desenvolvedores podem usar livremente suas saídas para treinar modelos antigos. A coleção de modelos Llama3 405B pode usar os resultados de seus modelos para aprimorar outros modelos, como gerar dados sintéticos e destilação. Podemos esperar um aumento de modelos robustos e de alto desempenho que sigam a ética do código aberto.

Assistente de Codificação

Os usuários podem interagir com o assistente digital da Meta, alimentado pelo Llama3 405B, que é capaz de responder perguntas complexas e resolver problemas de codificação.

Aplicações Multilíngues

O Llama3 405B é projetado para usos comerciais e de pesquisa em vários idiomas. Modelos somente texto ajustados por instrução são adequados para chat, enquanto modelos pré-treinados podem ser personalizados para várias tarefas de geração de linguagem natural.

Oportunidades para Desenvolvedores de API

Os desenvolvedores competirão para oferecer as APIs mais eficientes e econômicas para implantar o Llama3 405B. Isso apresenta uma oportunidade única para os desenvolvedores compararem como diferentes plataformas lidam com este grande modelo. Os vencedores serão aqueles que fornecerem APIs que gerenciam a carga computacional enquanto mantêm a precisão e minimizam os custos.

Conclusão

Com o lançamento do Llama3 405B, este modelo será um avanço crucial na tecnologia AI, mesclando dados extensos com treinamento de modelo de ponta. O lançamento deve desencadear uma nova onda de aplicações e estudos de AI, levando ao progresso na destilação de modelos e inferência extensa.

Ao longo deste blog, exploramos a comparação entre os modelos da família Llama3, os principais recursos e aplicações preditivas do modelo Llama3 405. O lançamento atual é um modelo base, e no futuro, seu desempenho e aplicações trarão surpresas para os desenvolvedores.

Novita AI é a plataforma tudo-em-um na nuvem que impulsiona suas ambições de AI. APIs integradas, sem servidor, instância GPU — as ferramentas econômicas que você precisa. Elimine a infraestrutura, comece gratuitamente e torne sua visão de AI realidade.

Leitura Recomendada

1.Meta Llama 3: O Mais Novo da Família de Modelos Llama está Chegando para Agitar

2.Guia de Início Rápido de Como Usar o Llama 3

3.Llama 3 vs ChatGPT 4: Um Guia de Comparação