Qwen 2.5 7B Agora Gratuito na Novita AI – Poderoso, Multilíngue e Pronto para Código

Qwen 2.5 7B Agora Gratuito na Novita AI – Poderoso, Multilíngue e Pronto para Código
  • Qwen 2.5 7B oferece capacidades avançadas de programação e matemática, melhor seguimento de instruções e geração de texto estruturado.
  • O modelo suporta comprimentos de contexto de até 128K tokens, permitindo resultados mais abrangentes e coerentes.
  • A Novita AI oferece o modelo Qwen 2.5 7B gratuitamente para apoiar e contribuir com a comunidade de código aberto.

O Qwen 2.5 7B é um poderoso modelo de linguagem de código aberto projetado para atender às diversas necessidades de desenvolvedores e pesquisadores. Com melhorias significativas em áreas-chave, ele se destaca como um recurso valioso para a comunidade. Abaixo estão os principais destaques deste modelo:

O que é o Qwen 2.5 7B?

introdução ao qwen 2.5 7b

Além disso, como uma família de modelos, o Qwen 2.5 também inclui outros modelos, cobrindo diferentes tamanhos de parâmetros, janelas de contexto e domínios especializados (geral, código e matemática).

Família Qwen 2.5

família qwen 2.5

Arquiteturas e Escalas Diversas de Modelos
A série Qwen2.5 abrange tamanhos de modelo que vão de 0,5B a 72B parâmetros, atendendo às necessidades de diversos cenários, desde aplicações leves até as de grande escala.
O número de camadas e cabeças de atenção (Q/KV) aumenta com o tamanho do modelo, resultando em maior complexidade do modelo.

Janela de Contexto e Comprimento de Geração
A maioria dos modelos base tem um comprimento de contexto de 128K, enquanto modelos menores (0.5B, 1.5B, 3B) têm 32K, e as versões Math têm 4K.
O comprimento de geração principal é de 8K, enquanto as versões Coder e Math têm 2K.

Mudanças no Tie Embedding
Modelos menores (0.5B, 1.5B, 3B) e todas as versões Coder/Math-1.5B usam Tie Embedding, enquanto modelos maiores não.
Isso pode ajudar a melhorar a eficiência dos parâmetros e a generalização para modelos menores.

Tipos Ricos de Modelos
Além dos modelos de uso geral, também existem sub-séries Coder (especializada em código) e Math (especializada em matemática), atendendo às necessidades de diferentes domínios verticais.

Benchmark do Qwen 2.5 7B

benchmark do qwen 2.5 7b

Requisitos de Hardware do Qwen 2.5 7B

requisitos de hardware do qwen 2.5 7b

Como Acessar o Qwen 2.5 7B?

A Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer uma nuvem de GPU acessível e confiável para construção e escalabilidade.

Passo 1: Faça Login e Acesse a Biblioteca de Modelos

Faça login na sua conta e clique no botão Biblioteca de Modelos.

Faça Login e Acesse a Biblioteca de Modelos

Experimente o Qwen 2.5 7B Agora!

Passo 2: Inicie Seu Teste Gratuito

Inicie seu teste gratuito para explorar as capacidades do modelo selecionado.

inicie um teste gratuito no gemma 3

Passo 3: Obtenha Sua Chave de API

Para autenticar com a API, forneceremos a você uma nova chave de API. Acessando a página “Configurações”, você pode copiar a chave de API conforme indicado na imagem.

obter chave de api

Passo 4: Instale a API

Instale a API usando o gerenciador de pacotes específico da sua linguagem de programação.

instalar api no gemma 3

Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o LLM da Novita AI. Este é um exemplo de uso da API de chat completions para usuários de Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "qwen/qwen2.5-7b-instruct"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

O Qwen 2.5 7B estabelece um novo padrão em modelos de linguagem de código aberto, oferecendo desempenho excepcional em codificação, matemática e compreensão multilíngue. Sua versatilidade, escalabilidade e uso eficiente de hardware o tornam a melhor escolha para desenvolvedores e empresas que buscam capacidades de IA de ponta.

Perguntas Frequentes

Como o Qwen 2.5 7B se compara a modelos semelhantes?

O Qwen 2.5 7B supera muitos modelos concorrentes em benchmarks de matemática, codificação e gerais, especialmente em tarefas de contexto longo e dados estruturados.

Como posso acessar o Qwen 2.5 7B?

Você pode implantar o Qwen 2.5 7B através da plataforma Novita AI, que oferece integração fácil com API e soluções escaláveis de nuvem de GPU.

Quais são os requisitos de hardware para o Qwen 2.5 7B?

Para precisão FP16, uma única RTX 4090 (24GB) é recomendada. Para FP32, são necessárias duas placas RTX 4090. Com quantização Q4, ele pode rodar em uma RTX 3060.

Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer uma nuvem de GPU acessível e confiável para construção e escalabilidade.

Leitura Recomendada