Desenvolvedores que gerenciam bases de código grandes ou fluxos de trabalho com múltiplos documentos enfrentam desafios persistentes, incluindo alto custo computacional, desempenho instável em contexto longo e compreensão de código inconsistente ao usar modelos Transformer convencionais. Essas restrições limitam a eficiência de iteração, restringem a análise em escala de repositórios e aumentam os custos operacionais. A introdução do DeepSeek V3.2 resolve esses pontos de dor ao integrar a DeepSeek Sparse Attention (DSA), um mecanismo projetado para reduzir a sobrecarga de atenção, acelerar o raciocínio de contexto e estabilizar a geração de código.
Este artigo examina como o DeepSeek V3.2 melhora a eficiência de custos, o processamento de contexto longo e as capacidades focadas em código. Apresenta orientações operacionais para implantar o DeepSeek V3.2 por meio da Novita AI e do Claude Code.
Atenção, por favor! A Novita AI está lançando sua campanha “Mês da Construção”, oferecendo aos desenvolvedores um incentivo exclusivo de até 20% de desconto em todos os principais produtos!
Participe do Mês da Construção!
Quais são as Novas Funcionalidades de Codificação no DeepSeek V3.2?
A DSA é um mecanismo de atenção revolucionário que muda fundamentalmente como o modelo processa informações. Enquanto os Transformers tradicionais exigem que cada token preste atenção a todos os outros tokens — resultando em custo computacional quadrático (O(n²)) — a DSA introduz um mecanismo de seleção granular e ciente do conteúdo:
- Filtragem Inteligente: Durante o treinamento, o modelo aprende a identificar quais relações de tokens são verdadeiramente importantes para tarefas específicas
- Conexões Dinâmicas: Seleção em tempo real das conexões de atenção necessárias com base no conteúdo de entrada.
- Otimização de Tarefas: Foca em diferentes padrões estruturais ao processar código versus documentos jurídicos
Três Melhorias Principais Habilitadas pela DSA
A Autoadaptação Direta é empregada como um mecanismo auxiliar para melhorar o desempenho geral do modelo sem alterar a arquitetura principal. Por meio dessa abordagem, o modelo alcança uma eficiência de custos significativa ao permitir uma inferência mais econômica, preservando a qualidade de geração e análise de código comparável à v3.1, apoiando assim testes frequentes e iteração rápida.
A DSA também fortalece a utilização de contexto longo, aproveitando efetivamente uma janela de contexto de até 128K tokens, o que melhora a análise simultânea de múltiplos arquivos, a compreensão de dependências entre arquivos e o processamento de documentação técnica complexa.
Além disso, a DSA contribui para capacidades relacionadas a código aprimoradas, incluindo resposta de inferência mais rápida, compreensão de código mais precisa e qualidade de geração de código mais estável, aprimorando coletivamente a confiabilidade e a eficiência do modelo em cenários de desenvolvimento de software em larga escala.
Framework de Aprendizado por Reforço Escalável
Ao adotar um protocolo robusto de aprendizado por reforço e escalar a computação pós-treinamento, o DeepSeek-V3.2 alcança desempenho comparável ao GPT-5. Notavelmente, a variante de alta computação, DeepSeek-V3.2-Speciale, supera consistentemente o GPT-5 e demonstra capacidades de raciocínio equivalentes às do Gemini-3.0-Pro.
| Benchmark | Métrica | DeepSeek-V3.2-Speciale | DeepSeek-V3.2-Thinking | GPT-5-High | Claude-4.5-Sonnet | Gemini-3.0-Pro |
|---|---|---|---|---|---|---|
| AIME 2025 | Pass@1 (%) | 96.0 | 93.1 | 94.6 | 87.0 | 95.0 |
| HMMT 2025 | Pass@1 (%) | 99.2 | 90.2 | 88.3 | 79.2 | 97.5 |
| HLE | Pass@1 (%) | 30.6 | 25.1 | 26.3 | 13.7 | 37.7 |
| Codeforces | Rating | 2701 | 2386 | 2537 | 1480 | 2708 |
| SWE Verified | Resolvido (%) | – | 73.1 | 74.9 | 77.2 | 76.2 |
| Terminal Bench 2.0 | Precisão (%) | – | 46.4 | 35.2 | 42.8 | 54.2 |
| τ² Bench | Pass@1 (%) | – | 80.3 | 80.2 | 84.7 | 85.4 |
| Tool Decathlon | Pass@1 (%) | – | 35.2 | 29.0 | 38.6 | 36.4 |
Experimente o DeepSeek V3.2 com 20% de desconto!
DeepSeek V3.2: O que foi feito para colaborar melhor com os desenvolvedores?
Para integrar melhor o raciocínio em cenários de uso de ferramentas, a DeepSeek introduziu um Pipeline de Síntese de Tarefas Agênticas em Grande Escala durante a etapa de pós-treinamento da V3.2. A ideia central é gerar sistematicamente dados de treinamento agênticos em larga escala, em vez de confiar em prompts criados manualmente ou demonstrações humanas limitadas.
Esse pipeline constrói programaticamente tarefas que exigem que o modelo raciocine, decida, chame ferramentas, observe resultados intermediários e ajuste seu comportamento de acordo. Ao expor o modelo a uma grande variedade de interações estruturadas, a DeepSeek permite um pós-treinamento agêntico escalável, melhorando significativamente tanto a conformidade comportamental quanto a generalização em ambientes interativos complexos e de múltiplas etapas, como busca, codificação e fluxos de trabalho aumentados por ferramentas.
As duas atualizações mais importantes são:
Um formato de chamada de ferramentas revisado, projetado para ser mais explícito e mais estável em interações de múltiplas etapas
Suporte nativo para “pensar com ferramentas”, onde o raciocínio e o uso de ferramentas são integrados estruturalmente, em vez de intercalados de forma solta
Para ajudar a comunidade a entender e adotar esse novo modelo, a DeepSeek fornece uma pasta encoding dedicada. Essa pasta inclui scripts Python e casos de teste que demonstram: como codificar mensagens compatíveis com a OpenAI em uma única string de entrada esperada pelo DeepSeek-V3.2 e como analisar a saída de texto do modelo de volta para mensagens estruturadas.
import transformers
# encoding/encoding_dsv32.py
from encoding_dsv32 import encode_messages, parse_message_from_completion_text
tokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")
messages = [
{"role": "user", "content": "hello"},
{"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."},
{"role": "user", "content": "1+1=?"}
]
encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)
prompt = encode_messages(messages, **encode_config)
tokens = tokenizer.encode(prompt)
Vale ressaltar que esta versão não inclui um modelo de chat baseado em Jinja. A implementação Python fornecida é a referência autoritativa. Além disso, a função de análise de saída assume saídas de modelo bem formadas e se destina a demonstração e experimentação, não para uso direto em produção sem tratamento de erros adicional.
Experimente o DeepSeek V3.2 com 20% de desconto!
Por que o Papel de developer é Necessário
Em cenários de agentes do mundo real, um modelo geralmente precisa lidar com três tipos distintos de informações simultaneamente:
- A intenção real do usuário ou o objetivo da tarefa
- O próprio processo de raciocínio e tomada de decisão do modelo
- Estratégias de busca, restrições de ferramentas e regras de execução fornecidas pelo sistema ou desenvolvedor
Em versões anteriores, esses sinais eram geralmente misturados em prompts de usuário ou sistema. Com o tempo, isso levou a dois problemas principais. Primeiro, o modelo poderia ter dificuldade em distinguir a intenção do usuário de restrições comportamentais obrigatórias. Segundo, à medida que as cadeias de ferramentas se tornavam mais complexas, a estabilidade e a confiabilidade da invocação de ferramentas degradavam-se perceptivelmente.
O papel developer introduzido no DeepSeek-V3.2 essencialmente serve como um canal de controle dedicado para agentes de busca e agentes orientados a ferramentas. Ele é projetado para transportar instruções estritamente relacionadas ao comportamento do agente, como escopo de busca, ordem de uso de ferramentas ou restrições de política, sem participar da semântica conversacional comum. Essa separação explícita permite uma compreensão contextual mais clara e estabelece uma base estrutural para um treinamento agêntico mais escalável e robusto.
Como Acessar o DeepSeek V3.2 no Claude Code?
A Novita AI oferece atualmente a API DeepSeek V3.2 de contexto completo mais acessível.
A Novita AI fornece APIs com contexto de 65K, e custos de $0,269/entrada e $0,4/saída, com suporte a saída estruturada e chamada de funções, o que oferece um forte suporte para maximizar o potencial do agente de código do DeepSeek V3.2.
Leitura de Cache: $0,1345 / M Token” indica o custo para ler tokens em cache quando ocorre um acerto de cache. Esses tokens foram calculados e armazenados anteriormente, portanto, não é necessária inferência adicional do modelo. Em sistemas onde muitas solicitações compartilham o mesmo prefixo de prompt, reutilizam histórico de conversas, instruções de ferramentas ou textos de regras fixas, ou onde os resultados de recuperação RAG são altamente repetitivos, uma alta taxa de acerto de cache pode ser alcançada, reduzindo significativamente o custo geral de inferência.
Primeiro: Obtenha a Chave de API
Passo 1: Faça login na sua conta e clique no botão da Biblioteca de Modelos.

Passo 2: Escolha o Seu Modelo
Navegue pelas opções disponíveis e selecione o modelo que atende às suas necessidades.

Passo 3: Inicie Seu Teste Gratuito
Inicie seu teste gratuito para explorar as capacidades do modelo selecionado.

Passo 4: Obtenha Sua Chave de API
Para autenticar com a API, forneceremos uma nova chave de API para você. Ao acessar a página de “Configurações”, você pode copiar a chave de API conforme indicado na imagem.

Passo 5: Instale a API
Instale a API usando o gerenciador de pacotes específico da sua linguagem de programação.
Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o LLM da Novita AI. Este é um exemplo de uso da API de conclusões de chat para usuários de Python.
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="deepseek/deepseek-v3.2",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=65536,
temperature=0.7
)
print(response.choices[0].message.content)
Use o DeepSeek V3.2 com o Claude Code
Passo 1: Instalando o Claude Code
Antes de instalar o Claude Code, certifique-se de que seu sistema atende aos requisitos mínimos. O Node.js 18 ou superior deve estar instalado no seu ambiente local. Você pode verificar sua versão do Node.js executando node --version no seu terminal.
Para Windows
Abra o Prompt de Comando e execute os seguintes comandos:
npm install -g @anthropic-ai/claude-code
npx win-claude-code@latest
A instalação global garante que o Claude Code esteja acessível de qualquer diretório no seu sistema. O comando npx win-claude-code@latest baixa e executa a versão mais recente específica para Windows.
Para Mac e Linux
Abra o Terminal e execute:
npm install -g @anthropic-ai/claude-code
Usuários de Mac podem prosseguir diretamente com a instalação global, sem necessidade de comandos específicos de plataforma adicionais. O processo de instalação configura automaticamente as dependências e variáveis de PATH necessárias.
Passo 2: Configurando as Variáveis de Ambiente
As variáveis de ambiente configuram o Claude Code para usar o DeepSeek V3.2 por meio dos endpoints de API da Novita AI. Essas variáveis informam ao Claude Code para onde enviar as solicitações e como autenticar.
Para Windows
Abra o Prompt de Comando e defina as seguintes variáveis de ambiente:
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API Key>
set ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
set ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"
Substitua <Novita API Key> pela sua chave de API real obtida na plataforma da Novita AI. Essas variáveis permanecem ativas para a sessão atual e devem ser redefinidas se você fechar o Prompt de Comando.
Para Mac e Linux
Abra o Terminal e exporte as seguintes variáveis de ambiente:
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
export ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"
Passo 3: Iniciando o Claude Code
Com a instalação e a configuração concluídas, você agora pode iniciar o Claude Code no diretório do seu projeto. Navegue até o local do projeto desejado usando o comando cd:
cd <your-project-directory>
claude .
O parâmetro ponto (.) instrui o Claude Code a operar no diretório atual. Ao iniciar, você verá o prompt do Claude Code aparecer em uma sessão interativa.
Isso indica que a ferramenta está pronta para receber suas instruções. A interface fornece um ambiente limpo e intuitivo para interações de programação em linguagem natural.
Passo 4: Usando o Claude Code no VSCode ou Cursor
O Claude Code se integra perfeitamente aos ambientes de desenvolvimento populares. Ele aprimora seu fluxo de trabalho existente, em vez de substituí-lo.
Você pode usar o Claude Code diretamente no terminal dentro do VSCode ou do Cursor. Isso mantém o acesso às suas ferramentas de desenvolvimento familiares enquanto aproveita a assistência de IA.
Além disso, plugins do Claude Code estão disponíveis para VSCode e Cursor.
Como Usar Modelos Externos no Claude Code?
Se você deseja alternar dinamicamente entre diferentes modelos de linguagem grandes (por exemplo, Claude da Anthropic, GLM da Zhipu e Kimi da Moonshot) no seu fluxo de trabalho de desenvolvimento, existem estratégias para fazer isso sem alterações extensas de código. Esta seção explica como trocar modelos rapidamente usando APIs unificadas e alternâncias de configuração.
Usando Variáveis de Ambiente (abordagem do Claude Code):
Se você está trabalhando com ferramentas como o Claude Code ou um SDK vinculado a uma API específica, pode alternar modelos simplesmente ajustando sua configuração de ambiente. A Novita AI fornece várias opções de modelos que você pode experimentar para encontrar a melhor opção.

O DeepSeek V3.2 introduz a DSA como uma atualização arquitetônica direcionada que reduz substancialmente o custo computacional, aumenta a eficácia de contexto longo e melhora a precisão centrada em código, mantendo um desempenho de raciocínio competitivo. O modelo permite análise escalável de repositórios grandes e documentos técnicos complexos, demonstrando um equilíbrio favorável entre eficiência e capacidade em comparação com o DeepSeek V3.1-Terminus e alternativas proprietárias. Esses avanços estabelecem o DeepSeek V3.2 como uma solução econômica para fluxos de trabalho de desenvolvimento sustentados e aplicações de IA de contexto longo.
Perguntas Frequentes
Qual é a principal vantagem da DeepSeek Sparse Attention (DSA) dentro do DeepSeek V3.2?
O DeepSeek V3.2 usa a DSA para ativar seletivamente conexões de atenção, reduzindo o custo quadrático de atenção enquanto preserva a compreensão precisa de código em contextos longos.
Como o DeepSeek V3.2 difere do DeepSeek V3.1-Terminus em fluxos de trabalho de codificação práticos?
O DeepSeek V3.2 oferece custo operacional menor, uma janela de contexto de 128K e maior estabilidade de inferência em comparação com o DeepSeek V3.1-Terminus, resultando em uma análise de código em escala de repositório mais eficiente.
O DeepSeek V3.2 melhora o processamento de documentos técnicos de contexto longo?
Sim. O DeepSeek V3.2 suporta análise simultânea de documentos complexos e relacionamentos entre arquivos, superando o DeepSeek V3.1-Terminus em tarefas de raciocínio com múltiplos documentos.
A Novita AI é a plataforma de nuvem tudo-em-um que capacita suas ambições de IA. APIs integradas, serverless, Instâncias de GPU — as ferramentas econômicas que você precisa. Elimine a infraestrutura, comece gratuitamente e torne sua visão de IA uma realidade.
Leituras Recomendadas
Como Acessar o Qwen 3 Coder: Qwen Code; Claude Code; Trae
DeepSeek vs Qwen: Identifique Qual Ecossistema se Adequa às Necessidades de Produção

