O KAT-Dev-32B na Novita AI está definindo novos padrões para IA open-source na engenharia de software. Com 32B de parâmetros e um processo de treinamento em múltiplas etapas, o modelo equilibra eficiência e desempenho, permanecendo totalmente aberto para pesquisadores e desenvolvedores. No SWE-Bench Verified, ele resolve 62,4% das tarefas, ficando em 5º lugar entre modelos open-source de todas as escalas. Desenvolvido pela Kwaipilot, a equipe de exploração de IA do Kuaishou, o modelo foi projetado para levar inteligência de código avançada a desenvolvedores de todo o mundo.
Preços atuais na Novita AI: janela de contexto de 65.536, $0,15 por 1M de tokens de entrada, $0,40 por 1M de tokens de saída
Experimente DeepSeek KAT-Dev-32B Demo
O que é o KAT-Dev-32B?
O KAT-Dev-32B é um modelo de linguagem grande open-source de 32B de parâmetros, projetado para tarefas de engenharia de software. Ele foi desenvolvido pela Kwaipilot, a equipe de pesquisa de IA do Kuaishou que explora capacidades de ponta de modelos grandes. Construído sobre o Qwen3-32B, ele foi otimizado para geração de código, correção de bugs, refatoração, testes e fluxos de trabalho de implantação. Lançado sob a licença kwaipilot, ele está disponível no Hugging Face e acessível diretamente pelo Playground da Novita AI.
O que torna o KAT-Dev-32B diferente?
O KAT-Dev-32B se distingue por um pipeline de treinamento focado em tarefas, que fortalece o raciocínio no estilo de agentes e a integração com fluxos de trabalho de desenvolvedores. Diferente de LLMs genéricos, ele suporta interações longas de múltiplas turnos, uso de ferramentas e cenários voltados para desenvolvedores, como depuração ou configuração. Na Novita AI, essas vantagens são suportadas por infraestrutura escalável e interfaces fáceis de usar, oferecendo aos usuários acesso instantâneo a inteligência de codificação open-source.
Como o KAT-Dev-32B é treinado?
O desempenho do KAT-Dev-32B é resultado de três estágios cuidadosamente projetados de treinamento e ajuste.
Treinamento Intermediário
Este estágio constrói habilidades fundamentais, desde o uso de ferramentas em ambientes sandbox até o tratamento de diálogos longos de múltiplas turnos e a compreensão de dados de commits/PRs do Git. Ele também incorpora conhecimento de codificação específico do domínio e capacidades de seguir instruções.
Ajuste Fino Supervisionado e por Reforço
Neste estágio, o modelo é curado com oito tipos de tarefas (como correção de bugs, otimização, refatoração, compreensão de código) e oito cenários de programação (que variam de ML/IA até engenharia de segurança). Antes do aprendizado por reforço, um estágio de ajuste fino por reforço (RFT) adiciona “trajetórias de professor” — exemplos de engenheiros humanos especializados que melhoram a estabilidade e a generalização.
Escalonamento de RL Agêntico
A fase final de escalonamento resolve desafios de eficiência no RL com técnicas avançadas:
- Cache de prefixo para computação de probabilidades mais rápida
- Poda de trajetórias baseada em entropia para preservar apenas nós de alto valor
- Arquitetura SeamlessFlow para desacoplar o treinamento do comportamento do agente e maximizar a vazão
Como o KAT-Dev-32B se sai no SWE-Bench?
O KAT-Dev-32B atinge 62,4% de resolução no SWE-Bench Verified, ficando em 5º lugar entre modelos open-source de escalas variadas. Isso demonstra que um modelo de 32B treinado de forma eficiente pode atingir confiabilidade de codificação no mundo real comparável a sistemas muito maiores.

Começando a usar o KAT-Dev-32B na Novita AI
Acessar o KAT-Dev-32B pela Novita AI é simples, com opções para usuários não técnicos e desenvolvedores.
Acesso via Playground
- Acesso instantâneo: Cadastre-se e comece a experimentar o KAT-Dev-32B em segundos
- Interface interativa: Teste prompts de codificação, depure aplicações e visualize respostas em tempo real
- Comparação de modelos: Compare o KAT-Dev-32B com outros modelos para avaliar sua adequação
O Playground é ideal para prototipação, depuração e exploração de comportamentos do modelo sem nenhuma configuração.
Integração via API
Para desenvolvedores, a Novita AI fornece uma API REST unificada para integrar o KAT-Dev-32B em aplicações.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key="",
)
model = "kwaipilot/kat-dev"
stream = True # or False
max_tokens = 32768
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Essa integração flexível suporta temperatura, penalidades, controle de repetição e saídas de streaming para fluxos de trabalho de produção.
Ferramentas de Terceiros
A Novita AI garante compatibilidade com o ecossistema mais amplo:
- Funciona com IDEs como Cursor, Qwen Code, Codex e Cline
- Conecta-se com ferramentas de orquestração como LangChain, Dify, CrewAI e Langflow
- Fornece suporte de inferência do Hugging Face para implantação em todo o ecossistema
Conclusão
O KAT-Dev-32B na Novita AI torna a inteligência de código avançada acessível por meio de disponibilidade open-source e infraestrutura de nuvem escalável. Com seu pipeline de treinamento em três estágios, escalonamento de RL agêntico e fortes resultados no benchmark SWE-Bench, ele se destaca como uma solução confiável tanto para tarefas de codificação de pesquisa quanto para produção. Desenvolvido pela Kwaipilot, a equipe de exploração de IA do Kuaishou, ele combina pesquisa de ponta com aplicações práticas de engenharia de software.
Comece a construir de forma mais inteligente hoje mesmo — explore o KAT-Dev-32B no Playground da Novita AI ou integre-o diretamente via API para trazer o desempenho de codificação de próxima geração para seus fluxos de trabalho.
A Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma forma fácil de implantar modelos de IA usando nossa API simples, além de fornecer uma nuvem de GPU acessível e confiável para construir e escalar.
