DeepSeek-R1-0528 e DeepSeek-R1-0528-Qwen3-8B Agora Disponíveis na Novita AI

DeepSeek-R1-0528 e DeepSeek-R1-0528-Qwen3-8B Agora Disponíveis na Novita AI

A DeepSeek lançou dois modelos inovadores — DeepSeek-R1-0528 e DeepSeek-R1-0528-Qwen3-8B — ambos agora disponíveis na Novita AI, uma plataforma de nuvem de IA que oferece aos desenvolvedores implantação fácil de modelos de IA através de nossa API direta. Esses modelos oferecem capacidades de raciocínio excepcionais a preços competitivos, com desempenho significativamente melhor do que seus antecessores.

A Novita AI oferece ambos os modelos DeepSeek-R1-0528 a taxas competitivas com preços transparentes de pagamento por uso:

DeepSeek-R1-0528 (Modelo Completo):

  • Tokens de entrada: US$ 0,7 por milhão de tokens
  • Tokens de saída: US$ 2,5 por milhão de tokens

DeepSeek-R1-0528-Qwen3-8B (Modelo 8B Eficiente):

  • Tokens de entrada: US$ 0,06 por milhão de tokens
  • Tokens de saída: US$ 0,09 por milhão de tokens

Experimente o DeepSeek-R1-0528 Demo

O que é o DeepSeek-R1-0528?

O modelo DeepSeek R1 passou por uma atualização de versão menor, sendo a versão atual o DeepSeek-R1-0528. Nesta atualização mais recente, o DeepSeek R1 melhorou significativamente sua profundidade de raciocínio e capacidades de inferência, aproveitando recursos computacionais aumentados e introduzindo mecanismos de otimização algorítmica durante o pós-treinamento.

O modelo demonstra desempenho excepcional em várias avaliações de benchmark, incluindo matemática, programação e lógica geral. Seu desempenho geral agora se aproxima de modelos líderes, como O3 e Gemini 2.5 Pro.

Principais Melhorias do DeepSeek-R1-0528

🔹 Desempenho aprimorado em benchmarks em tarefas de matemática, codificação e raciocínio
🔹 Capacidades de front-end aprimoradas para melhor experiência do usuário
🔹 Redução de alucinações para saídas mais confiáveis
🔹 Suporte a saída JSON e chamada de funções para integração perfeita

Profundidade de Raciocínio Aprimorada

Em comparação com a versão anterior, o modelo atualizado mostra melhorias significativas no manuseio de tarefas complexas de raciocínio. Por exemplo, no teste AIME 2025, a precisão do modelo aumentou de 70% na versão anterior para 87,5% na versão atual.

Esse avanço decorre da profundidade de pensamento aprimorada durante o processo de raciocínio: no conjunto de teste AIME, o modelo anterior usou uma média de 12K tokens por pergunta, enquanto a nova versão utiliza em média 23K tokens por pergunta.

Desempenho Competitivo contra Líderes do Setor

O DeepSeek-R1-0528 demonstra desempenho notável quando comparado a modelos líderes do setor em vários benchmarks desafiadores:

deepseek r1 0528 benchmark

DeepSeek-R1 vs DeepSeek-R1-0528

Desempenho em Raciocínio Matemático

Benchmark DeepSeek R1 DeepSeek R1-0528 Melhoria
AIME 2024 (Pass@1) 79,8 91,4 +11,6
AIME 2025 (Pass@1) 70,0 87,5 +17,5
HMMT 2025 (Pass@1) 41,7 79,4 +37,7
CNMO 2024 (Pass@1) 78,8 86,9 +8,1

Aprimoramento de Desempenho em Codificação

Benchmark DeepSeek R1 DeepSeek R1-0528 Melhoria
LiveCodeBench (Pass@1) 63,5 73,3 +9,8
Codeforces-Div1 (Rating) 1530 1930 +400
SWE Verified (Resolved) 49,2 57,6 +8,4
Aider-Polyglot (Acc.) 53,3 71,6 +18,3

Tarefas de Raciocínio Geral

Benchmark DeepSeek R1 DeepSeek R1-0528 Melhoria
MMLU-Redux (EM) 92,9 93,4 +0,5
MMLU-Pro (EM) 84,0 85,0 +1,0
GPQA-Diamond (Pass@1) 71,5 81,0 +9,5
SimpleQA (Correct) 30,1 27,8 -2,3
FRAMES (Acc.) 82,5 83,0 +0,5
Humanity’s Last Exam (Pass@1) 8,5 17,7 +9,2

Novas Capacidades de Integração de Ferramentas

O DeepSeek-R1-0528 introduz capacidades aprimoradas em chamada de funções e integração de ferramentas:

  • BFCL_v3_MultiTurn (Acc): 37,0%
  • Tau-Bench (Pass@1): 53,5% (Airline) / 63,9% (Retail)

DeepSeek-R1-0528-Qwen3-8B: Excelência Compacta

A DeepSeek destilou o raciocínio em cadeia de pensamento do DeepSeek-R1-0528 para criar o DeepSeek-R1-0528-Qwen3-8B a partir do Qwen3 8B Base. Este modelo atinge desempenho de ponta (SOTA) entre modelos de código aberto no AIME 2024, superando o Qwen3-8B em +10,0% e igualando o desempenho do Qwen3-235B-thinking.

Isso demonstra que o raciocínio em cadeia de pensamento do DeepSeek-R1-0528 tem grande importância tanto para a pesquisa acadêmica em modelos de raciocínio quanto para o desenvolvimento industrial focado em modelos de pequena escala.

Análise Competitiva com Modelos Líderes

Modelo AIME 24 AIME 25 HMMT Fev 25 GPQA Diamond LiveCodeBench
Qwen3-235B-A22B 85,7 81,5 62,5 71,1 66,5
Qwen3-32B 81,4 72,9 - 68,4 -
Qwen3-8B 76,0 67,3 - 62,0 -
Phi-4-Reasoning-Plus-14B 81,3 78,0 53,6 69,3 -
Gemini-2.5-Flash-Thinking-0520 82,3 72,0 64,2 82,8 62,3
o3-mini (medium) 79,6 76,7 53,3 76,8 65,9
DeepSeek-R1-0528-Qwen3-8B 86,0 76,3 61,5 61,1 60,5

Melhorias de Uso e Detalhes Técnicos

Recursos de Usabilidade Aprimorados

Em comparação com versões anteriores do DeepSeek-R1, as recomendações de uso do DeepSeek-R1-0528 incluem as seguintes melhorias:

  • Suporte a prompt de sistema: Ao contrário de versões anteriores, agora você pode usar prompts de sistema para fornecer contexto e instruções consistentes
  • Padrão de pensamento automático: Sem necessidade de ativação manual — o modelo ativa automaticamente suas capacidades de raciocínio sem precisar de " thinking\ " no início das saídas

Arquitetura do DeepSeek-R1-0528-Qwen3-8B

A arquitetura do modelo DeepSeek-R1-0528-Qwen3-8B é idêntica à do Qwen3-8B, mas compartilha a mesma configuração de tokenizador que o DeepSeek-R1-0528. Este modelo pode ser executado da mesma forma que o Qwen3-8B, mas certifique-se de que todos os arquivos de configuração venham do repositório da DeepSeek, não do projeto Qwen3 original.

Por que os Desenvolvedores Escolhem a Novita AI

Implantação Simplificada de Modelos de IA

  • Sem complicações de infraestrutura: Concentre-se em construir aplicações, não em gerenciar servidores
  • Acesso instantâneo ao modelo: Implante modelos de ponta com uma única chamada de API
  • Desempenho confiável: Infraestrutura de nível empresarial com 99,9% de uptime
  • Disponibilidade global: Acesso de baixa latência de qualquer lugar do mundo

Perfeito para Qualquer Escala

  • Prototipagem rápida: Teste ideias rapidamente com acesso imediato ao modelo
  • Pronto para produção: Dimensione perfeitamente do protótipo à produção
  • Custo-benefício: Pague apenas pelo que usar com preços transparentes
  • Suporte empresarial: Suporte dedicado para aplicações de alto volume

Casos de Uso Ideais

  • Aplicações de IA Matemática: Construa plataformas de tutoria que atingem 87,5% de precisão no AIME 2025
  • Ferramentas de Geração de Código: Crie assistentes de desenvolvimento com 73,3% de sucesso no LiveCodeBench
  • Plataformas de Pesquisa: Implante modelos de raciocínio que competem com líderes do setor
  • Software Educacional: Desenvolva aplicações de resolução de problemas passo a passo

Começando na Novita AI

  1. Cadastre-se em segundos na Novita AI e ganhe US$ 10 em créditos gratuitos
  2. Explore o DeepSeek-R1-0528 (capacidade completa) ou o DeepSeek-R1-0528-Qwen3-8B (eficiente)
  3. Obtenha sua chave de API no painel de controle
  4. Faça sua primeira chamada de API usando nossos endpoints compatíveis com OpenAI
  5. Comece a construir com capacidades de raciocínio líderes do setor

Para usuários Python:

from openai import OpenAI

base_url = "https://api.novita.ai/v3/openai"
api_key = "<Sua Chave de API>"
model = "deepseek/deepseek-r1-0528"

client = OpenAI(
    base_url=base_url,
    api_key=api_key,
)

stream = True # ou False
max_tokens = 1000

response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        
        {
            "role": "user",
            "content": "Olá!",
        }
    ],
    stream=stream,
    extra_body={
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

Conclusão

Os modelos da série DeepSeek-R1-0528 oferecem desempenho líder do setor a preços competitivos — alcançando 91,4% no AIME 2024 e 73,3% no LiveCodeBench, rivalizando com as capacidades do OpenAI-o3 e Gemini-2.5-Pro.

Através da plataforma amigável para desenvolvedores da Novita AI, você obtém acesso instantâneo a esses modelos de ponta sem complexidade de infraestrutura. Com preços transparentes, US$ 10 em créditos gratuitos e nossa API intuitiva, integrar raciocínio de classe mundial em suas aplicações nunca foi tão fácil.

Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer a nuvem de GPU acessível e confiável para construir e escalar.