O Qwen3-Coder-Next foi desenvolvido para codificação agêntica: tarefas de software de múltiplos passos onde o modelo precisa planejar, chamar ferramentas, se recuperar de falhas e manter o contexto ao longo de fluxos de trabalho longos.
Na Novita AI, você pode executar o Qwen3-Coder-Next por meio de uma API compatível com OpenAI, obtendo desempenho de agente de codificação de alta qualidade sem precisar implantar ou gerenciar sua própria infraestrutura de GPU.
Experimente o Qwen3-Coder-Next
O que é o Qwen3-Coder-Next?
Visão geral do modelo
| Item | Detalhes |
| Organização | Equipe Qwen (Alibaba) |
| Data de lançamento | 4 de fevereiro de 2026 |
| Parâmetros | 80B no total / ~3B ativados (MoE) |
| Arquitetura | Atenção Híbrida + MoE de alta esparsidade (Layout híbrido com Gated DeltaNet + Atenção Gated) |
| Janela de contexto | 262.144 tokens (256K) nativa, extensível |
O Qwen3-Coder-Next é um modelo de código agêntico de pesos abertos otimizado para obter fortes resultados em benchmarks do mundo real, mantendo os custos de inferência baixos. Seu design MoE limita os parâmetros ativos em tempo de execução, e a atenção híbrida permite raciocínio de longo contexto. O modelo foi projetado para se integrar diretamente a fluxos de trabalho de codificação práticos — ferramentas de CLI, agentes de IDE e chamadas de ferramentas estruturadas — permanecendo rápido o suficiente para o desenvolvimento do dia a dia.
Benchmarks e desempenho
Benchmark

Principais conclusões práticas
- Forte desempenho no SWE-Bench Verified Uma pontuação de 70,6% indica que o modelo consegue lidar com correção de bugs reais em nível de repositório, incluindo busca, aplicação de patches e loops de teste — um sinal importante para agentes de codificação de nível de produção.
- Suporte multilíngue competitivo para repositórios A pontuação de 62,8% no SWE-Bench Multilingual sugere que o modelo não é estritamente voltado para o inglês, sendo adequado para equipes globais com issues, comentários e documentação em vários idiomas.
- Resultados sólidos no SWE-Bench Pro Uma pontuação de 44,3% no subconjunto Pro mais difícil reflete um raciocínio de longo horizonte mais forte, especialmente em cenários de depuração e recuperação de múltiplos passos.
- Relevância do TerminalBench para uso de ferramentas O TerminalBench 2.0 avalia loops estruturados de comando/saída, que se alinham de perto com automação de DevOps, depuração de CI e agentes baseados em shell.
- A pontuação do Aider suporta codificação interativa Uma pontuação de 66,2% no Aider é um bom indicador para fluxos de trabalho de programação em par, como edições iterativas, refatorações e desenvolvimento incremental de funcionalidades.
Velocidade e latência
A experiência do desenvolvedor depende fortemente da latência, não apenas da precisão bruta:

Por que isso importa na Novita AI
O Qwen3-Coder-Next foi desenvolvido para ser eficiente — com 80B de parâmetros no total, mas apenas ~3B ativos durante a inferência — tornando-o especialmente econômico para cargas de trabalho de codificação agêntica. Na Novita AI, essa eficiência se traduz diretamente em preços previsíveis e competitivos:
- Entrada: $0,20 / milhão de tokens
- Saída: $1,50 / milhão de tokens
Combinado com a API escalável da Novita AI, você pode implantar agentes de codificação de alto desempenho que lidam com raciocínio de longo contexto e fluxos de trabalho de múltiplos passos — sem gerenciar GPUs ou incorrer em custos de infraestrutura imprevisíveis.
Como acessar o Qwen 3 na Novita AI
Início rápido: Playground
Para a avaliação mais rápida, comece pelo Playground da Novita para experimentar prompts, comparar modelos e validar a qualidade da saída antes da integração.

Use o Qwen3-Coder-Next via API
Como obter chaves de API
- Passo 1: Crie ou faça login na sua conta: Acesse
[https://novita.ai](https://novita.ai)e cadastre-se ou faça login. - Passo 2: Acesse o gerenciamento de chaves: Após fazer login, encontre a seção “Chaves de API”.
- Passo 3: Crie uma nova chave: Clique no botão “Adicionar nova chave”.
- Passo 4: Salve sua chave imediatamente: Copie e armazene a chave assim que ela for gerada; ela é exibida apenas uma vez.

Use os exemplos de código abaixo para integrar com nossa API:
Python (Exemplo)
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["NOVITA_API_KEY"],
base_url="https://api.novita.ai/v3/openai",
)
resp = client.chat.completions.create(
model="Qwen/Qwen3-Coder-Next",
messages=[
{"role": "system", "content": "You are a senior software engineer."},
{"role": "user", "content": "Fix the bug and write tests. Here is the stack trace: ..."}
],
temperature=0.2,
)
print(resp.choices[0].message.content)
SDK
Se você está construindo agentes, a Novita se integra perfeitamente com frameworks que esperam conclusões de chat da OpenAI:
- Compatibilidade com o OpenAI Agents SDK
- Os SDKs padrão da OpenAI para Python/Node funcionam com alterações mínimas graças à compatibilidade de API
Plataformas de terceiros
Os modelos hospedados na Novita também podem ser usados em muitos ecossistemas populares — para que você possa levar o Qwen3-Coder-Next para ferramentas existentes sem alterar seu fluxo de trabalho:
- Frameworks de agentes e construtores de apps: Guias de integração para o Continue, AnythingLLM, LangChain e Langflow.
- Hugging Face Hub: A Novita está listada como um Provedor de Inferência, permitindo execuções de modelos suportadas por meio do ecossistema de provedores do Hugging Face.
- Ferramentas compatíveis com OpenAI: A Novita segue o padrão de API da OpenAI, para que você possa conectar apps e ferramentas no estilo OpenAI, como o Cline, Cursor, Trae e Qwen Code com alterações mínimas.
- Acesso compatível com Anthropic: A Novita também suporta integração compatível com o SDK da Anthropic para fluxos de trabalho no estilo do Claude Code.
- OpenCode e observabilidade: Use a Novita diretamente no OpenCode.
Conclusão
O Qwen3-Coder-Next atinge um ponto ideal prático: força em codificação agêntica, raciocínio de longo contexto e alta vazão, alimentado por um design MoE que mantém os custos de execução sob controle. Para equipes que desejam lançar agentes de codificação — ou simplesmente acelerar fluxos de trabalho de desenvolvimento — executar o Qwen3-Coder-Next na Novita AI por meio de sua API compatível com OpenAI é um dos caminhos mais simples da avaliação para a produção.
A Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer uma nuvem de GPU acessível e confiável para construção e escalonamento.
Perguntas Frequentes
O que é o Qwen3-Coder-Next?
O Qwen3-Coder-Next é um modelo de codificação de pesos abertos da equipe Qwen, desenvolvido para codificação agêntica (tarefas de codificação de múltiplos passos com uso de ferramentas, feedback de execução e recuperação). Ele é baseado no Qwen3-Next-80B-A3B-Base e usa uma arquitetura de atenção híbrida + MoE para obter desempenho de codificação/agente de alta qualidade com menor custo de inferência.
Quanto custa o Qwen3 Coder?
Na Novita AI, o Qwen3-Coder-Next é precificado em $0,20 por 1M de tokens de entrada e $1,50 por 1M de tokens de saída (serverless)
Quais provedores de API oferecem o Qwen3-Coder-Next?
O Qwen3-Coder-Next está disponível por meio de vários provedores de API, sendo a Novita AI uma opção econômica e compatível com OpenAI. Outros provedores incluem Chutes, Parasail e Together AI, que diferem em latência, vazão e preços.
