Como Implantar o DeepSeek-R1-0528-Qwen3-8B nas Instâncias de GPU da Novita AI

Como Implantar o DeepSeek-R1-0528-Qwen3-8B nas Instâncias de GPU da Novita AI

E se você pudesse executar um modelo de 8 bilhões de parâmetros que supera modelos 30 vezes maiores?

O DeepSeek-R1-0528-Qwen3-8B oferece desempenho de raciocínio revolucionário, igualando modelos de 235B de parâmetros em tarefas matemáticas complexas, enquanto roda eficientemente em uma única RTX 4090.

Este guia mostra como implantar esse modelo transformador na Novita AI em minutos.

O que é o DeepSeek-R1-0528-Qwen3-8B

O DeepSeek-R1-0528-Qwen3-8B é um modelo de raciocínio sofisticado criado ao destilar capacidades de chain-of-thought do DeepSeek-R1-0528 no modelo base Qwen3 8B. Essa abordagem inovadora produziu um modelo open-source de ponta que alcança desempenho notável em benchmarks de matemática e raciocínio, incluindo o AIME 2024, onde supera o Qwen3 8B em +10,0% e iguala o desempenho do modelo muito maior Qwen3-235B-thinking.

O modelo demonstra capacidades excepcionais em várias métricas de avaliação, obtendo 86,0 no AIME 24, 76,3 no AIME 25 e 61,5 no HMMT Feb 25. O que torna esse modelo particularmente valioso é sua capacidade de entregar desempenho de raciocínio comparável a modelos muito maiores, mantendo a eficiência e a facilidade de implantação de um modelo de 8B de parâmetros.

Benchmark do DeepSeek-R1-0528-Qwen3-8B

Por que executar o DeepSeek-R1-0528-Qwen3-8B nas Instâncias de GPU da Novita AI?

1. Vantagem significativa de preço e modelos de precificação flexíveis

A Novita AI oferece preços competitivos no mercado de computação GPU, tornando modelos avançados de IA como o DeepSeek-R1-0528-Qwen3-8B acessíveis para pesquisadores, empresas e desenvolvedores em qualquer escala.

Escolha entre preços Sob Demanda e Assinatura com base nos seus padrões de uso. Para o DeepSeek-R1-0528-Qwen3-8B executando em RTX 4090:

  • Sob Demanda: $0,35/hora – Adequado para testes e cargas de trabalho variáveis
  • 1–5 meses: $226,80/mês (10% OFF) – Projetos de médio prazo
  • 6–11 meses: $206,64/mês (18% OFF) – Ciclos de desenvolvimento estendidos
  • 12 meses: $189,00/mês (25% OFF) – Maior economia para compromissos de longo prazo

A assinatura anual pode economizar centenas de dólares, garantindo a disponibilidade garantida de recursos. Saiba mais sobre modelos de precificação.

2. Múltiplas opções de GPU para otimização de desempenho

A Novita AI oferece opções abrangentes de GPU para atender às suas necessidades computacionais e orçamento:

  • RTX 3090 24GB: Custo-benefício para desenvolvimento e teste
  • RTX 4090 24GB: Recomendado para DeepSeek-R1-0528-Qwen3-8B – equilíbrio entre desempenho e custo
  • RTX 5090 32GB
  • RTX 6000 Ada 48GB: VRAM aprimorada para contextos maiores
  • L40S 48GB: Desempenho profissional com capacidade de memória estendida
  • A100 SXM 80GB: Computação de alto desempenho com largura de banda substancial de memória
  • H100 SXM 80GB: Desempenho nível empresarial para implantações em produção

3. Modelos prontos para uso e flexibilidade personalizada

Modelos pré-configurados para modelos populares como DeepSeek-R1-0528-Qwen3-8B eliminam a complexidade da configuração manual, incluindo configurações otimizadas de contêiner, variáveis de ambiente e parâmetros de implantação testados. Usuários avançados podem criar modelos totalmente personalizados com configurações especializadas e scripts de implantação personalizados, garantindo tanto a facilidade de uso para iniciantes quanto a personalização total para desenvolvedores experientes.

4. Rede de implantação global

Implante instâncias de GPU mais próximas dos seus usuários através da rede mundial da Novita AI, com 15 regiões nas Américas (EUA, Canadá, Brasil), Ásia-Pacífico (Japão, Singapura, Índia, EAU, Hong Kong) e Europa (Alemanha, Reino Unido). Essa infraestrutura global garante latência reduzida e desempenho confiável para sua implantação do DeepSeek-R1-0528-Qwen3-8B, proporcionando acesso confiável independentemente da localização do usuário.

Como Implantar o DeepSeek-R1-0528-Qwen3-8B na Novita AI

Passo 1: Seleção do Modelo

Selecione o modelo DeepSeek-R1-0528-Qwen3-8B na biblioteca de modelos. Escolha uma RTX 4090 como tipo de GPU e clique em Implantar.

escolha a 4090

Passo 2: Confirmação dos Parâmetros

Revise os parâmetros de implantação exibidos na tela de configuração. Verifique se todas as configurações estão corretas e clique em Avançar para prosseguir.

use o modelo

Passo 3: Implantação da Instância

Clique em Implantar para iniciar o processo de criação da instância. O sistema começará a provisionar sua instância de GPU.

implante o modelo

Passo 4: Acompanhe o Progresso da Implantação

Navegue até Gerenciamento de Instâncias para acessar o console de controle. Este painel permite acompanhar o status da implantação em tempo real.

Passo 5: Visualize o Status de Pull da Imagem

Clique na sua instância específica para monitorar o progresso do download da imagem do contêiner. Esse processo pode levar alguns minutos, dependendo das condições da rede.

Passo 6: Acompanhe o Download do Modelo

Após a instância iniciar, ela começará a baixar o modelo. Clique em “Logs” → “Logs da Instância” para monitorar o progresso do download do modelo.

Passo 7: Verifique a Implantação Bem-sucedida

Procure pela mensagem "Application startup complete." nos logs da instância. Isso indica que o processo de implantação foi concluído com sucesso.

Passo 8: Obtenha a URL de Acesso

Clique em “Conectar”, depois clique em “Conectar ao Serviço HTTP [Porta 8000]”. Como este é um serviço de API, você precisará copiar o endereço.

URL do site

Passo 9: Acesse Seu Modelo Implantado

Para fazer requisições ao seu modelo, substitua http://7a65a32b51e37482-8000.jp-tyo-1.gpu-instance.novita.ai pelo seu endereço exposto real. Copie o código a seguir para acessar seu modelo privado!

# Chame o servidor usando curl:
curl -X POST "http://7a65a32b51e37482-8000.jp-tyo-1.gpu-instance.novita.ai/v1/chat/completions" \
        -H "Content-Type: application/json" \
        --data '{
                "model": "deepseek-ai/DeepSeek-R1-0528-Qwen3-8B",
                "messages": [
                        {
                                "role": "user",
                                "content": "What is the capital of France?"
                        }
                ]
        }'
{"id":"chatcmpl-56d12c91edbb46fcb93ccbbc0ecddd2c","object":"chat.completion","created":1748588145,"model":"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B","choices":[{"index":0,"message":{"role":"assistant","reasoning_content":null,"content":"\
The capital of France is **Paris**.","tool_calls":[]},"logprobs":null,"finish_reason":"stop","stop_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":294,"completion_tokens":284,"prompt_tokens_details":null},"prompt_logprobs":null}

Configure o endereço da API em seus aplicativos, como o Chatbox, e você terá seu próprio assistente pessoal!

A Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer uma nuvem de GPU acessível e confiável para construir e escalar.