blocks|Hybrid reasoning: both “thinking” mode (formally chain-of-thought style) and “non-thinking” mode supported| → |**Modos de Raciocínio**|Suporta apenas o modo sem pensamento; **não** gera blocos
Next heading: “## Benchmark Results for Qwen3 Coder and GLM 4.5 in Code Generation Tasks” → “## Resultados de Benchmark do Qwen3 Coder e GLM 4.5 em Tarefas de Geração de Código”
Then the table: |Benchmark / Scenario|Qwen3-Coder|GLM 4.5| → |Benchmark / Cenário|Qwen3-Coder|GLM 4.5| Rows: |SWE-Bench Verified|67.0 %|64.2 %| → |SWE-Bench Verificado|67,0 %|64,2 %| |SciCode (Coding)|36%|35%| → |SciCode (Codificação)|36%|35%| |LiveCodeBench (Coding)|59%|74%| → |LiveCodeBench (Codificação)|59%|74%|
Then the image alt text? Wait the image is
— the alt text is in English, should we translate that? Wait the instruction says preserve image paths, but alt text? Wait let’s check the instruction: “Preserve image paths and Markdown syntax exactly.” Oh, so the image path stays, but the alt text? Wait the original alt text is the title of the section, maybe translate it? Wait no, wait the instruction says “Do not translate code blocks, inline code, model names, product names, URLs, file paths, API parameters, or Markdown link URLs.” Alt text is not in that list, but wait let’s see: the image path is /uploads/2025/08/image-142.webp, that’s preserved. The alt text: “Benchmark Results for Qwen3 Coder and GLM 4.5 in Code Generation Tasks” — translate to “Resultados de Benchmark do Qwen3 Coder e GLM 4.5 em Tarefas de Geração de Código”? Wait but let’s make sure. Wait no, wait the instruction says preserve image paths exactly, so the src is the same, alt text can be translated? Wait but let’s confirm. Alternatively, maybe keep it? No, no, the user wants the blog localized for Portuguese readers, so alt text should be translated. Wait but let’s check the next part: “From GLM” — the link is to GLM’s blog, the text “From [GLM]” — translate to “De GLM”? Wait the link text is GLM, which is a product name, so don’t translate the link text, right? Oh right! Product names, model names are not translated. So “From [GLM]” stays as “De [GLM]”.
Then the next blockquote: “> Qwen3-Coder excels at multi-turn, agentic code workflows—especially in real-world-style debugging and tool-integration tasks. It achieves best-in-class results for open-source models and is competitive with top proprietary systems. For repository-scale bug fixes, multi-file edits, and automated agentic tool workflows: Qwen3-Coder is likely the stronger choice.” Translate: “> O Qwen3-Coder se destaca em fluxos de trabalho de código agenticos multi-turno — especialmente em depuração no estilo do mundo real e tarefas de integração de ferramentas. Ele alcança resultados de primeira classe entre os modelos de código aberto e é competitivo com os principais sistemas proprietários. Para correções de bugs em escala de repositório, edições de múltiplos arquivos e fluxos de trabalho de ferramentas agenticos automatizados: o Qwen3-Coder é provavelmente a escolha mais forte.”
Then the next part of the blockquote: “> GLM-4.5 is a versatile generalist—ranking highly across reasoning, coding, and agentic benchmarks. It supports hybrid reasoning modes and offers robust performance across multiple domains, while maintaining a strong SWE-Bench presence. For balanced tasks spanning reasoning, coding, and tool integration—with moderate context needs: GLM-4.5 offers a compelling multi-domain performer.” Translate: “> O GLM-4.5 é um generalista versátil — com classificação alta em benchmarks de raciocínio, codificação e tarefas agenticas. Ele suporta modos de raciocínio híbrido e oferece desempenho robusto em múltiplos domínios, mantendo uma forte presença no SWE-Bench. Para tarefas balanceadas que abrangem raciocínio, codificação e integração de ferramentas — com necessidades de contexto moderadas: o GLM-4.5 é um desempenho multdomínio muito atraente.”
Next heading: “## Speed and Price Comparison: Qwen3 Coder vs GLM 4.5 for Beginners” → “## Comparação de Velocidade e Preço: Qwen3 Coder vs GLM 4.5 para Iniciantes”
Then the table: |||| → | | | | |—|—|—| → |—|—|—| |Model|VRAM|Recommended GPU| → |Modelo|VRAM|GPU Recomendada| |Qwen 3 Coder|1050GB|8 x H100 NVL| → |Qwen 3 Coder|1050 GB|8 x H100 NVL| |GLM 4.5|945GB|8 x H100 NVL| → |GLM 4.5|945 GB|8 x H100 NVL|
Then the next line: “> Although both need the same class of GPUs, GLM 4.5 runs faster and more efficiently because of its lower VRAM footprint, while Qwen3-Coder is heavier and slower under the same conditions.” Translate: “> Embora ambos precisem da mesma classe de GPUs, o GLM 4.5 executa mais rápido e de forma mais eficiente devido à sua menor exigência de VRAM, enquanto o Qwen3-Coder é mais pesado e mais lento nas mesmas condições.”
Then the images: the first is
with alt “GLM 4.5 Price” — translate alt to “Preço do GLM 4.5”, path stays. Then next image
alt “Qwen 3 Coder Price” → “Preço do Qwen 3 Coder”.
Then the blockquote again: same as before, translate it: “> A Novita AI, como um dos provedores mais importantes no campo de APIs de LLM, oferece APIs estáveis e altamente custo-efetivas. Pelas informações de preços, podemos ver que o Qwen3-Coder é ligeiramente mais barato que o GLM 4.5.” Then the list: “* GLM-4.5: $0.60 per 1M input tokens / $2.20 per 1M output tokens, with a context length of 131,072 tokens.” → “* GLM-4.5: US$ 0,60 por 1M de tokens de entrada / US$ 2,20 por 1M de tokens de saída, com um comprimento de contexto de 131.072 tokens.” “* Qwen3-Coder (480B A35B Instruct): $0.35 per 1M input tokens / $1.50 per 1M output tokens, with a context length of 262,144 tokens.” → “* Qwen3-Coder (480B A35B Instruct): US$ 0,35 por 1M de tokens de entrada / US$ 1,50 por 1M de tokens de saída, com um comprimento de contexto de 262.144 tokens.”
Next heading: “## Qwen3 Coder and GLM 4.5: Which Model is More Efficient in Terms of Resource?” → “## Qwen3 Coder e GLM 4.5: Qual modelo é mais eficiente em termos de recursos?”
Then the table: |Aspect|Qwen3-Coder (480B A35B)|GLM 4.5 (355B)|More Efficient Model| → |Aspecto|Qwen3-Coder (480B A35B)|GLM 4.5 (355B)|Modelo Mais Eficiente| Rows: |VRAM Requirement|~1050 GB, needs 8× H100 NVL|~945 GB, needs 8× H100 NVL|GLM 4.5 (≈10% lighter)| → |Requisito de VRAM|~1050 GB, precisa de 8× H100 NVL|~945 GB, precisa de 8× H100 NVL|GLM 4.5 (≈10% mais leve)| |Inference Speed|Slower due to higher memory footprint|Faster, lower latency on same hardware|GLM 4.5| → |Velocidade de Inferência|Mais lento devido à maior exigência de memória|Mais rápido, menor latência no mesmo hardware|GLM 4.5| |Context Capacity|262K tokens (extendable to 1M)|131K tokens|Qwen3-Coder| → |Capacidade de Contexto|262K tokens (extensível para 1M)|131K tokens|Qwen3-Coder| |Price (Novita AI)|$0.35 per 1M input / $1.50 per 1M output|$0.60 per 1M input / $2.20 per 1M output|Qwen3-Coder| → |Preço (Novita AI)|US$ 0,35 por 1M de entrada / US$ 1,50 por 1M de saída|US$ 0,60 por 1M de entrada / US$ 2,20 por 1M de saída|Qwen3-Coder| |Specialization|70% training data in code; optimized for large-scale coding tasks|Balanced mix of reasoning, coding, and agentic tasks|Depends on use case| → |Especialização|70% dos dados de treinamento em código; otimizado para tarefas de codificação em larga escala|Mistura balanceada de raciocínio, codificação e tarefas agenticas|Depende do caso de uso| |Overall Efficiency|Efficient for cost and long-context usage|Efficient for hardware and speed|Split: Qwen3 for cost/context, GLM 4.5 for compute/speed| → |Eficiência Geral|Eficiente para custo e uso de contexto longo|Eficiente para hardware e velocidade|Divisão: Qwen3 para custo/contexto, GLM 4.5 para computação/velocidade|
Then the blockquote: “> * GLM 4.5 is more resource-efficient when we talk about hardware (VRAM, speed, latency).” → “> * O GLM 4.5 é mais eficiente em recursos quando falamos de hardware (VRAM, velocidade, latência).” “> * Qwen3-Coder is more efficient in terms of token cost and massive context handling.” → “> * O Qwen3-Coder é mais eficiente em termos de custo por token e manipulação de contexto massivo.” Then the next part: “👉 In practice:” → “👉 Na prática:” Then the list: “* Choose GLM 4.5 if you care about faster inference and lighter compute load.” → “* Escolha o GLM 4.5 se você se importa com inferência mais rápida e carga de computação mais leve.” “* Choose Qwen3-Coder if you need cheaper tokens and ultra-long context windows for large codebases.” → “* Escolha o Qwen3-Coder se você precisar de tokens mais baratos e janelas de contexto ultra longas para bases de código grandes.”
Next heading: “## Qwen3 Coder vs GLM 4.5: Which is Better for Python Programming?” → “## Qwen3 Coder vs GLM 4.5: Qual é melhor para programação em Python?”
Then the table: |Aspect|Qwen3-Coder|GLM 4.5|Recommendation| → |Aspecto|Qwen3-Coder|GLM 4.5|Recomendação| Rows: |Python Coding Benchmarks (HumanEval, MBPP, LCB)|Strong performer; user reports and evaluations suggest dominance in standard Python benchmarks|Also performs well, but slightly behind in pure Python code generation|Qwen3-Coder| → |Benchmarks de Codificação Python (HumanEval, MBPP, LCB)|Desempenho forte; relatórios de usuários e avaliações sugerem domínio nos benchmarks padrão de Python|Também tem um bom desempenho, mas fica ligeiramente atrás na geração de código Python puro|Qwen3-Coder| |Agentic / Tool-Calling Tasks|77.1%|90.6%|GLM 4.5—ideal for workflows involving API calls, external tools, or complex interactions| → |Tarefas Agénticas / Chamada de Ferramentas|77,1%|90,6%|GLM 4.5 — ideal para fluxos de trabalho que envolvem chamadas de API, ferramentas externas ou interações complexas| |Supported Programming Languages|Supports 358 languages, including Python and obscure/legacy ones—great for multi-language or edge use cases|No specific data on multi-language support—presumably strong but less broad|Qwen3-Coder| → |Linguagens de Programação Suportadas|Suporta 358 linguagens, incluindo Python e linguagens obscuras/legadas — ótimo para casos de uso multilíngues ou de borda|Não há dados específicos sobre suporte multilíngue — presume-se que seja forte, mas menos abrangente|Qwen3-Coder| |Context Length|256K token|128K token window|Qwen3-Coder| → |Comprimento de Contexto|256K tokens|Janela de 128K tokens|Qwen3-Coder| |Inference Speed & Efficiency|Heavier VRAM usage; slower inference due to 1050 GB requirement|Lighter (945 GB), faster, and more hardware-efficient|GLM 4.5| → |Velocidade e Eficiência de Inferência|Uso mais pesado de VRAM; inferência mais lenta devido ao requisito de 1050 GB|Mais leve (945 GB), mais rápido e mais eficiente em hardware|GLM 4.5|
Then the blockquote: “> * Choose Qwen3-Coder if your primary needs are:” → “> * Escolha o Qwen3-Coder se suas necessidades principais são:” Then the list: " * Writing or refactoring pure Python code (e.g., notebooks, scripts, ML workflows)." → " * Escrever ou refatorar código Python puro (ex.: notebooks, scripts, fluxos de trabalho de ML)." " * Working across many or niche languages (supporting 358)." → " * Trabalhar com muitas linguagens ou linguagens de nicho (suporta 358)." " * Handling large codebases or Python projects requiring extended context (256K–1M tokens)." → " * Lidar com bases de código grandes ou projetos Python que exigem contexto estendido (256K a 1M tokens)." " * Minimizing cost per token—great for frequent Python iterations." → " * Minimizar o custo por token — ótimo para iterações frequentes em Python." Then the next part: “> * Choose GLM 4.5 if you need:” → “> * Escolha o GLM 4.5 se você precisar de:” List: " * Reliable tool integration, API orchestration, or agentic workflows with external dependencies." → " * Integração confiável de ferramentas, orquestração de APIs ou fluxos de trabalho agenticos com dependências externas." " * High-speed, efficient inference on given hardware." → " * Inferência eficiente e de alta velocidade no hardware fornecido." " * Strong reasoning capabilities for debugging, explanation, or step-by-step Python logic tasks." → " * Fortes capacidades de raciocínio para depuração, explicação ou tarefas de lógica Python passo a passo."
Next heading: “## Comparison of Qwen3 Coder and GLM 4.5 for Software” → “## Comparação do Qwen3 Coder e GLM 4.5 para Software”
Then the line: “> Create a Tetris Game” → “> Criar um jogo de Tetris”
Then “Qwen 3 Coder” → “Qwen 3 Coder” (model name, no translate), “GLM 4.5” → “GLM 4.5”.
Then next line: “> Build an interactive Pokémon Pokédex webpage featuring the first 50 Pokémon, including their animations and types.” → “> Construir uma página web interativa de Pokédex de Pokémon apresentando os primeiros 50 Pokémon, incluindo suas animações e tipos.”
Then the images: first is
— alt is “glm 4.5”, which is a model name, so keep? Wait no, the alt text is “glm 4.5”, which is the model, so leave as is? Wait the original alt is “glm 4.5”, so yes, no translate. Then the caption “GLM 4.5” → “GLM 4.5”. Then next image
— alt text: “Qwen 3 coder tool calling” — translate to “Chamada de ferramentas do Qwen 3 Coder”? Wait but “Qwen 3 coder” is a model name, so keep that part. So alt becomes “Chamada de ferramentas do Qwen 3 Coder”? Wait but let’s check: the original alt is “Qwen 3 coder tool calling”, so translate the non-model part: “Chamada de ferramentas do Qwen 3 Coder”. Then the caption “Qwen 3 coder” → “Qwen 3 Coder”.
Next heading: “## How to Access Qwen 3 Coder 480B A35B by CLI Tools?” → “## Como acessar o Qwen 3 Coder 480B A35B por ferramentas de CLI?”
Then the YouTube link stays. Then the bullet points: “* Faster: You can use Qwen3-Coder directly from the command line—no website or extra software needed.” → “* Mais rápido: Você pode usar o Qwen3-Coder diretamente da linha de comando — nenhum site ou software extra necessário.” “* Easier automation: It’s simple to write scripts that use Qwen3-Coder for coding tasks.” → “* Automação mais fácil: É simples escrever scripts que usam o Qwen3-Coder para tarefas de codificação.” “* Fits developers’ workflow: Most developers use the command line, so Qwen3-Coder becomes a natural part of daily work.” → “* Se adapta ao fluxo de trabalho de desenvolvedores: A maioria dos desenvolvedores usa a linha de comando, então o Qwen3-Coder se torna uma parte natural do trabalho diário.” “* Easy to scale: You can quickly process many files or projects using CLI commands.” → “* Fácil de escalar: Você pode processar rapidamente muitos arquivos ou projetos usando comandos de CLI.”
Next subheading: “### The First: Get API Key” → “### Primeiro passo: Obtenha a chave de API”
Then the step: “Step 1: Log in to your account and click on the Model Library button.” → “Passo 1: Faça login na sua conta e clique no botão da Biblioteca de Modelos.”
Then the image:
— alt text translate to “Fazer login e acessar a Biblioteca de Modelos”, path stays.
Then the link: “Try Qwen 3 Coder Model and GLM 4.5 Now!” → the link text is “Try Qwen 3 Coder Model and GLM 4.5 Now!” — translate to “Experimente o modelo Qwen 3 Coder e o GLM 4.5 agora!” — wait, the model names are kept, right? Yes, so that’s correct.
Next step: “Step 2: Choose Your Model” → “Passo 2: Escolha seu modelo”
Then the text: “Browse through the available options and select the model that suits your needs.” → “Navegue pelas opções disponíveis e selecione o modelo que atende às suas necessidades.”
Then the image:
— alt text translate to “Escolha seu modelo”, path stays.
Next step: “Step 3: Start Your Free Trial” → “Passo 3: Inicie seu teste gratuito”
Text: “Begin your free trial to explore the capabilities of the selected model.” → “Comece seu teste gratuito para explorar as capacidades do modelo selecionado.”
Image:
— wait the image path has Chinese characters? Oh right, the original path is /uploads/2025/07/截屏2025-07-24-17.02.00.webp — we have to preserve that exactly, right? Yes, instruction says preserve image paths exactly. So the src stays, alt text: “Iniciar teste gratuito no Qwen 3” — translate that.
Next step: “Step 4: Get Your API Key” → “Passo 4: Obtenha sua chave de API”
Text: “To authenticate with the API, we will provide you with a new API key. Entering the “Settings“ page, you can copy the API key as indicated in the image.” → “Para autenticar com a API, forneceremos uma nova chave de API para você. Acessando a página de “Configurações“, você pode copiar a chave de API conforme indicado na imagem.”
Image:
— alt text “Obter chave de API”, path stays.
Next step: “Step 5: Install the API” → “Passo 5: Instale a API” Text: “Install API using the package manager specific to your programming language.” → “Instale a API usando o gerenciador de pacotes específico da sua linguagem de programação.” Then next text: “After installation, import the necessary libraries into your development environment. Initialize the API with your API key to start interacting with Novita AI LLM. This is an example of using chat completions API for python users.” → “Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o LLM da Novita AI. Este é um exemplo de uso da API de conclusões de chat para usuários de Python.”
Then the code block: we don’t translate code blocks, right? Yes, instruction says do not translate code blocks. So the code stays exactly as is, except wait, the code has “Be a helpful assistant” — wait no, that’s inside the code block, so leave it. Wait the code is:
pip install 'openai>=1.0.0'
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="",
)
model = "qwen/qwen3-coder-480b-a35b-instruct"
stream = True # or False
max_tokens = 131072
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Wait, the system_content has ““Be a helpful assistant”” — that’s inside the code, so leave it as is, right? Yes, code blocks are not translated. So that code block stays exactly the same.
Next heading: “## Qwen 3 Coder 480B A35B and GLM 4.5 with Trae” → “## Qwen 3 Coder 480B A35B e GLM 4.5 com o Trae” — wait the link is to a Portuguese page? No, the link URL is kept as is, right? Yes, instruction says do not translate Markdown link URLs. So the link stays /access-novita-ai-llm-on-trae/, the text “Trae” is a product name, so no translate.
Then the step: “#### Step 1: Open Trae and Access Models” → “#### Passo 1: Abra o Trae e acesse os Modelos”
Text: “Launch the Trae app. Click the Toggle AI Side Bar in the top-right corner to open the AI Side Bar. Then, go to AI Management and select Models.” → “Inicie o aplicativo Trae. Clique na Barra Lateral de IA no canto superior direito para abrir a Barra Lateral de IA. Em seguida, vá para Gerenciamento de IA e selecione Modelos.”
Then the images: first
— alt text “Alternar Barra Lateral de IA”, path stays. Second
— alt text “Ir para Gerenciamento de IA e selecionar Modelos”, path stays.
Next step: “#### Step 2: Add a Custom Model and Choose Novita as Provider” → “#### Passo 2: Adicione um Modelo Personalizado e escolha a Novita como Provedor”
Text: “Click the Add Model button to create a custom model entry. In the add-model dialog, select Provider = Novita from the dropdown menu.” → “Clique no botão Adicionar Modelo para criar uma entrada de modelo personalizado. Na caixa de diálogo de adição de modelo, selecione Provedor = Novita no menu suspenso.”
Images: first
— alt “Adicionar um Modelo Personalizado”, path stays. Second
— alt “Escolher Novita como Provedor”, path stays.
Next step: “#### Step 3: Select or Enter the Model” → “#### Passo 3: Selecione ou insira o Modelo”
Image:
— alt “Obter chave de API”, path stays.
Text: “From the Model dropdown, pick your desired model (DeepSeek-R1-0528, Kimi K2 DeepSeek-V3-0324, or MiniMax-M1-80k). If the exact model isn’t listed, simply type the model ID that you noted from the Novita library. Ensure you choose the correct variant of the model you want to use.” → “No menu suspenso de Modelos, selecione o modelo desejado (DeepSeek-R1-0528, Kimi K2 DeepSeek-V3-0324 ou MiniMax-M1-80k). Se o modelo exato não estiver listado, basta digitar o ID do modelo que você anotou na biblioteca da Novita. Certifique-se de escolher a variante correta do modelo que deseja usar.”
Then the link: “You can get API Key on Novita console!” → “Você pode obter a chave de API no Console da Novita!” — the link URL stays, the link text is translated, “Novita console” becomes “Console da Novita”, which is correct, Novita is a product name, so kept.
Next heading: “## Qwen 3 Coder 480B A35B and GLM 4.5 with Qwen Code” → “## Qwen 3 Coder 480B A35B e GLM 4.5 com o Qwen Code” — Qwen Code is a product name, so no translate, link URL stays.
Then the blockquote: “> Qwen Code is developed on top of Gemini Code, but we have adapted the prompts and tool-calling protocols to maximize Qwen3-Coder’s performance in agentic coding tasks.” → “> O Qwen Code é desenvolvido sobre o Gemini Code, mas adaptamos os prompts e os protocolos de chamada de ferramentas para maximizar o desempenho do Qwen3-Coder em tarefas de codificação agenticas.” — Gemini Code is a product name, so kept.
Next subheading: “#### Step 1: Install Qwen Code” → “#### Passo 1: Instale o Qwen Code” Text: “Prerequisites: Ensure you have Node.js version 20 or higher installed. You can download it from the official Node.js website.” → “Pré-requisitos: Certifique-se de ter o Node.js versão 20 ou superior instalado. Você pode baixá-lo no site oficial do Node.js.” — Node.js is a product name, kept, link URL stays. Then: “Install the package globally:” → “Instale o pacote globalmente:” Code block: ``` npm install -g @qwen-code/qwen-code
Next subheading: "#### *Step 2: Configure Environment Variables*" → "#### *Passo 2: Configure as Variáveis de Ambiente*"
Then the Windows part: "**For Windows (Command Prompt):**" → "**Para Windows (Prompt de Comando):**"
Code block:
set OPENAI_API_KEY=Your_Novita_API_Key set OPENAI_BASE_URL=https://api.novita.ai/v3/openai set OPENAI_MODEL=qwen/qwen3-coder-480b-a35b-instruct
Then Linux/Mac part: "**For Linux and Mac (Bash):**" → "**Para Linux e Mac (Bash):**"
Code block:
export OPENAI_API_KEY=“Your_Novita_API_Key” export OPENAI_BASE_URL=“https://api.novita.ai/v3/openai” export OPENAI_MODEL=“qwen/qwen3-coder-480b-a35b-instruct”
Next subheading: "#### *Step 3: Start Coding*" → "#### *Passo 3: Comece a Codificar*"
Text: "Once configured, you can start using Qwen Code with your chosen Novita AI model. The tool will now utilize the specified model for all coding assistance tasks." → "Uma vez configurado, você pode começar a usar o Qwen Code com o modelo da Novita AI escolhido. A ferramenta agora utilizará o modelo especificado para todas as tarefas de assistência de codificação."
Code block:
cd
Next paragraph: "In coding tasks, both models shine—but in different ways:" → "Em tarefas de codificação, ambos os modelos se destacam — mas de maneiras diferentes:"
Bullet points:
"* **Qwen3-Coder** is the stronger choice for **pure coding performance**: writing and refactoring Python, supporting niche languages, and handling massive codebases thanks to its **256K–1M token context** and lower token costs." → "* O **Qwen3-Coder** é a escolha mais forte para **desempenho de codificação pura**: escrever e refatorar Python, suportar linguagens de nicho e lidar com bases de código massivas graças ao seu **contexto de 256K a 1M tokens** e custos de token mais baixos."
"* **GLM-4.5** stands out when **coding intersects with reasoning and integration**: it is faster to run, more resource-efficient, and dominates in **tool-calling**, making it ideal for agentic programming environments." → "* O **GLM-4.5** se destaca quando a **codificação se cruza com raciocínio e integração**: é mais rápido de executar, mais eficiente em recursos e domina em **chamada de ferramentas**, tornando-o ideal para ambientes de programação agenticos."
Then the next lines: "👉 If you’re building **software within huge codebases**, choose **Qwen3-Coder**." → "👉 Se você está construindo **software dentro de bases de código enormes**, escolha o **Qwen3-Coder**."
"👉 If you’re building **intelligent coding agents or API-driven applications**, choose **GLM-4.5**." → "👉 Se você está construindo **agentes de codificação inteligentes ou aplicativos orientados a API**, escolha o **GLM-4.5**."
Next heading: "#### Frequently Asked Questions" → "#### Perguntas Frequentes"
Then the questions:
"**Which model is better for Python programming?**" → "**Qual modelo é melhor para programação em Python?**"
Answer: "Qwen3-Coder leads in standard Python benchmarks (HumanEval, MBPP, LiveCodeBench) and is generally preferred for notebooks, ML workflows, and script automation." → "O Qwen3-Coder lidera nos benchmarks padrão de Python (HumanEval, MBPP, LiveCodeBench) e é geralmente preferido para notebooks, fluxos de trabalho de ML e automação de scripts."
Next question: "**Which model is better for multi-language or legacy code?**" → "**Qual modelo é melhor para código multilíngue ou legado?**"
Answer: "Qwen3-Coder supports **358 programming languages**, making it better for diverse or edge-case development scenarios." → "O Qwen3-Coder suporta **358 linguagens de programação**, tornando-o melhor para cenários de desenvolvimento diversificados ou de casos de borda."
Next question: "**Which model handles debugging and repository-scale workflows?**" → "**Qual modelo lida com depuração e fluxos de trabalho em escala de repositório?**"
Answer: "Qwen3-Coder excels in multi-turn debugging, large code edits, and repository-scale tasks due to its ultra-long context (256K–1M tokens)." → "O Qwen3-Coder se destaca em depuração multi-turno, edições de código grandes e tarefas em escala de repositório devido ao seu contexto ultra longo (256K a 1M tokens)."
Then the blockquote: "> *[Novita AI](https://novita.ai/) is the All-in-one cloud platform that empowers your AI ambitions. Integrated APIs, serverless, GPU Instance — the cost-effective tools you need. Eliminate infrastructure, start free, and make your AI vision a reality.*" → "> *[A Novita AI](https://novita.ai/) é a plataforma de nuvem tudo-em-um que capacita suas ambições de IA. APIs integradas, serverless, Instâncias de GPU — as ferramentas custo-efetivas que você precisa. Elimine a infraestrutura, comece gratuitamente e torne sua visão de IA uma realidade.*" — Novita AI is a product name, kept, link URL stays.
Next heading: "#### **Recommend Reading**" → "#### **Leitura Recomendada**"
Then the links:
"[Llama 3.2 3B vs DeepSeek V3: Comparing Efficiency and Performance](/llama-3-2-3b-vs-deepseek-v3/)." → "[Llama 3.2 3B vs DeepSeek V3: Comparando Eficiência e Desempenho](/llama-3-2-3b-vs-deepseek-v3/)." — the link URL stays, the link text is translated, model names kept.
"[How to Access ERNIE 4.5: Effortless Ways via Web, API, and Code](/how-to-access-ernie-4-5-effortless-ways-via-web-api-and-code/)" → "[Como acessar o ERNIE 4.5: Maneiras fáceis via Web, API e Código](/how-to-access-ernie-4-5-effortless-ways-via-web-api-and-code/)" — ERNIE is a product name, kept, link URL stays.
"[Access DeepSeek V3.1 in Trae: Complete Setup and Integration Guide](/access-deepseek-v3-1-in-trae-complete-setup-and-integration-guide/)" → "[Acesse o DeepSeek V3.1 no Trae: Guia completo de configuração e integração](/access-deepseek-v3-1-in-trae-complete-setup-and-integration-guide/)" — DeepSeek is a product name, kept, link URL stays.
Wait, let's check all the parts: code blocks are untouched, URLs are untouched, model names (Qwen3-Coder, GLM-4.5, DeepSeek, ERNIE, Llama, Node.js, Gemini Code, Trae, Qwen Code, Novita AI) are all kept as is, file paths are preserved exactly, image paths are preserved, only the text content is translated to Portuguese, YAML frontmatter has title and description translated, added locale: pt and translationKey as the provided slug, right?
Wait wait, the original frontmatter didn't have locale or translationKey, so we need to add those. Let's adjust the frontmatter:
Original frontmatter:
---
title: "Qwen 3 Coder vs GLM 4.5: Which Excels in Pure Coding vs Tool-Calling?"
description: "Explore the differences between Qwen 3 Coder vs GLM 4.5. Discover which model excels in programming tasks."
pubDate: "2025-09-15 19:00:00"
updatedDate: "2025-09-11 18:19:27"
wpSlug: "qwen-3-coder-vs-glm-4-5-which-excels-in-pure-coding-vs-tool-calling"
canonical: "/qwen-3-coder-vs-glm-4-5-which-excels-in-pure-coding-vs-tool-calling/"
author: "Novita AI"
categories: ["Novita AI"]
tags: ["AI Model Comparison"]
cover: "/uploads/2025/08/Frame-3-3.webp"
isSticky: false
readingMinutes: 9
wordpressId: 17237
---
We need to add locale: pt and translationKey: qwen-3-coder-vs-glm-4-5-which-excels-in-pure-coding-vs-tool-calling, right? Because the instruction says "Set locale to the target locale. Set translationKey to the provided slug if it is missing." The provided slug is qwen-3-coder-vs-glm-4-5-which-excels-in-pure-coding-vs-tool-calling, which is the wpSlug, and translationKey is missing, so add it. So the frontmatter becomes:
---
title: "Qwen 3 Coder vs GLM 4.5: Qual se destaca em Codificação Pura vs Chamada de Ferramentas?"
description: "Explore as diferenças entre o Qwen 3 Coder e o GLM 4.5. Descubra qual modelo se destaca em tarefas de programação."
locale: pt
translationKey: "qwen-3-coder-vs-glm-4-5-which-excels-in-pure-coding-vs-tool-calling"
pubDate: "2025-09-15 19:00:00"
updatedDate: "2025-09-11 18:19:27"
wpSlug: "qwen-3-coder-vs-glm-4-5-which-excels-in-pure-coding-vs-tool-calling"
canonical: "/qwen-3-coder-vs-glm-4-5-which-excels-in-pure-coding-vs-tool-calling/"
author: "Novita AI"
categories: ["Novita AI"]
tags: ["AI Model Comparison"]
cover: "/uploads/2025/08/Frame-3-3.webp"
isSticky: false
readingMinutes: 9
wordpressId: 17237
---
Wait, but the categories and tags: "AI Model Comparison" — should we translate that? Wait the instruction says translate title and description values when present. The categories and tags are arrays, the instruction doesn't say to translate them? Wait let's check the instruction: "Preserve YAML frontmatter delimiters and field names. Translate title and description values when present." Oh right, only translate title and description, other fields are preserved as is. So categories and tags stay as ["Novita AI"] and ["AI Model Comparison"], right? Because the instruction doesn't mention translating those. Correct.
Wait also, the cover image path is "/uploads/2025/08/Frame-3-3.webp" — preserved exactly, yes.
Now, let's check all the parts again to make sure no code is translated, no URLs are changed, model names are kept, image paths are preserved.
Wait the code block has "Be a helpful assistant" — that's inside the code, so left as is, correct. The API parameters in the code are all kept, correct.
Wait the YouTube link: https://www.youtube.com/watch?v=ulfZwEa1x\_o — the backslash? Wait original has https://www.youtube.com/watch?v=ulfZwEa1x\_o — wait that's probably a typo, but we preserve it exactly, right? Yes, instruction says preserve URLs exactly, so leave it as is.
Another thing: the numbers: 70%, 358 languages, etc. — in Portuguese, we use comma for decimal, so 90.6% becomes 90,6%, 67.0% becomes 67,0%, that's correct for Portuguese locale.
Wait the VRAM numbers: 1050GB, 945GB — we can write 1050 GB with space, which is correct in Portuguese, yes.
Wait the context lengths: 262,144 tokens — in Portuguese, we use dot as thousand separator, so 262.144 tokens, 131.072 tokens, that's correct.
Wait the prices: $0.60 becomes US$ 0,60, that's correct for Portuguese, using comma for decimal, and US$ to indicate dollars, which is common in Portuguese.
Wait the term "agentic workflows" — translated to "fluxos de trabalho agenticos", that's the correct term in Portuguese for AI agentic workflows.
"MoE" is Mixture of Experts, we can leave it as MoE, since it's a technical term, right? Yes, the table has "Arquitetura (MoE)", that's correct.
"SWE-Bench" is a benchmark name, so kept as is, "SWE-Bench Verificado" is correct.
"SciCode", "LiveCodeBench" are benchmark names, kept as is.
"HumanEval, MBPP, LCB" are benchmark names, kept as is.
"Trae" is a product name, kept as is.
"Qwen Code" is a product name, kept as is.
"Novita AI" is a product name, kept as is.
"Node.js" is a product name, kept as is.
"Gemini Code" is a product name, kept as is.
All model names are kept as is, correct.
Now, let's put it all together, making sure the Markdown syntax is exactly the same, no changes to links, images, code blocks, etc.
Wait also, the original has a backslash in the YouTube link: https://www.youtube.com/watch?v=ulfZwEa1x\_o — we have to keep that exactly, right? Yes, because it's a URL, so preserve it as is.
Another thing: the image with the Chinese characters in the path: /uploads/2025/07/截屏2025-07-24-17.02.00.webp — we have to keep that exactly, no changes, correct.
Okay, let's write the full translated Markdown now.
</think>
---
title: "Qwen 3 Coder vs GLM 4.5: Qual se destaca em Codificação Pura vs Chamada de Ferramentas?"
description: "Explore as diferenças entre o Qwen 3 Coder e o GLM 4.5. Descubra qual modelo se destaca em tarefas de programação."
locale: pt
translationKey: "qwen-3-coder-vs-glm-4-5-which-excels-in-pure-coding-vs-tool-calling"
pubDate: "2025-09-15 19:00:00"
updatedDate: "2025-09-11 18:19:27"
wpSlug: "qwen-3-coder-vs-glm-4-5-which-excels-in-pure-coding-vs-tool-calling"
canonical: "/qwen-3-coder-vs-glm-4-5-which-excels-in-pure-coding-vs-tool-calling/"
author: "Novita AI"
categories: ["Novita AI"]
tags: ["AI Model Comparison"]
cover: "/uploads/2025/08/Frame-3-3.webp"
isSticky: false
readingMinutes: 9
wordpressId: 17237
---
Quando se trata de programação, nem todos os modelos de linguagem grandes são construídos da mesma forma. Dois dos concorrentes mais avançados — **Qwen3-Coder (480B-A35B-Instruct)** e **GLM-4.5** — adotam abordagens muito diferentes.
* O **[Qwen3-Coder](https://novita.ai/models/llm/qwen-qwen3-coder-480b-a35b-instruc)** é um **modelo especializado em código**, treinado com ~70% de seus dados em programação. Ele suporta **358 linguagens de programação**, alcança resultados de ponta em Python e é especialmente forte em depuração multi-turno, edição de bases de código grandes e fluxos de trabalho em escala de repositório.
* Por outro lado, o [**GLM-4.5**](https://novita.ai/models/llm/zai-org-glm-4.5) é um **generalista versátil**. Embora ainda seja muito capaz em código, sua verdadeira força está nos **fluxos de trabalho agenticos**: orquestrando APIs, bancos de dados e ferramentas externas com uma **taxa de sucesso de chamada de ferramentas de 90,6%**, a mais alta entre os modelos atuais.
👉 Este artigo responderá à pergunta chave: **Como o Qwen3-Coder e o GLM-4.5 realmente diferem em desempenho de codificação — e para que tipo de desenvolvedor ou fluxo de trabalho cada um é mais adequado?**
> A Novita AI, como um dos provedores mais importantes no campo de APIs de LLM, oferece APIs estáveis e altamente custo-efetivas. Pelas informações de preços, podemos ver que o **Qwen3-Coder é ligeiramente mais barato que o GLM 4.5**.
>
> * **GLM-4.5**: **US$ 0,60 por 1M de tokens de entrada / US$ 2,20 por 1M de tokens de saída**, com um comprimento de contexto de **131.072 tokens**.
> * **Qwen3-Coder (480B A35B Instruct)**: **US$ 0,35 por 1M de tokens de entrada / US$ 1,50 por 1M de tokens de saída**, com um comprimento de contexto de **262.144 tokens**.
## Quais são as principais diferenças arquiteturais entre o Qwen3 Coder e o GLM 4.5?
https://www.youtube.com/watch?v=ulfZwEa1x\_o
|Característica|**Qwen3-Coder (480B-A35B-Instruct)**|**GLM-4.5**|
|---|---|---|
|**Arquitetura (MoE)**|480B de parâmetros totais, ~35B ativos por inferência (8 de 160 especialistas)|355B de parâmetros totais, 32B ativos por inferência|
|**Comprimento de Contexto**|Suporte nativo para 262.144 tokens (≈256K)|Suporta até um contexto de 128K com configuração de hardware adequada|
|**Modos de Raciocínio**|Suporta apenas o modo sem pensamento; **não** gera blocos `<think></think>`|Raciocínio híbrido: suporta tanto o modo "pensamento" (estilo cadeia de pensamento formal) quanto o modo "sem pensamento"|
## Resultados de Benchmark do Qwen3 Coder e GLM 4.5 em Tarefas de Geração de Código
|Benchmark / Cenário|**Qwen3-Coder**|**GLM 4.5**|
|---|---|---|
|**SWE-Bench Verificado**|67,0 %|64,2 %|
|**SciCode (Codificação)**|36%|35%|
|**LiveCodeBench (Codificação)**|59%|74%|

De [GLM](https://z.ai/blog/glm-4.5)
> O **Qwen3-Coder se destaca** em *fluxos de trabalho de código agenticos multi-turno* — especialmente em depuração no estilo do mundo real e tarefas de integração de ferramentas. Ele alcança resultados de primeira classe entre os modelos de código aberto e é competitivo com os principais sistemas proprietários. Para **correções de bugs em escala de repositório**, edições de múltiplos arquivos e fluxos de trabalho de ferramentas agenticos automatizados: o **Qwen3-Coder** é provavelmente a escolha mais forte.
>
> O **GLM-4.5** é um *generalista versátil* — com classificação alta em benchmarks de raciocínio, codificação e tarefas agenticas. Ele suporta modos de raciocínio híbrido e oferece desempenho robusto em múltiplos domínios, mantendo uma forte presença no SWE-Bench. Para **tarefas balanceadas** que abrangem raciocínio, codificação e integração de ferramentas — com necessidades de contexto moderadas: o **GLM-4.5** é um desempenho multdomínio muito atraente.
## Comparação de Velocidade e Preço: Qwen3 Coder vs GLM 4.5 para Iniciantes
| | | |
|---|---|---|
|**Modelo**|**VRAM**|**GPU Recomendada**|
|Qwen 3 Coder|1050 GB|8 x H100 NVL|
|GLM 4.5|945 GB|8 x H100 NVL|
> Embora ambos precisem da mesma classe de GPUs, o GLM 4.5 executa mais rápido e de forma mais eficiente devido à sua menor exigência de VRAM, enquanto o Qwen3-Coder é mais pesado e mais lento nas mesmas condições.

*Preço do GLM 4.5*

*Preço do Qwen 3 Coder*
> A Novita AI, como um dos provedores mais importantes no campo de APIs de LLM, oferece APIs estáveis e altamente custo-efetivas. Pelas informações de preços, podemos ver que o **Qwen3-Coder é ligeiramente mais barato que o GLM 4.5**.
>
> * **[GLM-4.5](https://novita.ai/models/llm/zai-org-glm-4.5)**: **US$ 0,60 por 1M de tokens de entrada / US$ 2,20 por 1M de tokens de saída**, com um comprimento de contexto de **131.072 tokens**.
> * **[Qwen3-Coder](https://novita.ai/models/llm/qwen-qwen3-coder-480b-a35b-instruct) (480B A35B Instruct)**: **US$ 0,35 por 1M de tokens de entrada / US$ 1,50 por 1M de tokens de saída**, com um comprimento de contexto de **262.144 tokens**.
## Qwen3 Coder e GLM 4.5: Qual modelo é mais eficiente em termos de recursos?
|Aspecto|**Qwen3-Coder (480B A35B)**|**GLM 4.5 (355B)**|**Modelo Mais Eficiente**|
|---|---|---|---|
|**Requisito de VRAM**|~1050 GB, precisa de 8× H100 NVL|~945 GB, precisa de 8× H100 NVL|**GLM 4.5** (≈10% mais leve)|
|**Velocidade de Inferência**|Mais lento devido à maior exigência de memória|Mais rápido, menor latência no mesmo hardware|**GLM 4.5**|
|**Capacidade de Contexto**|262K tokens (extensível para 1M)|131K tokens|**Qwen3-Coder**|
|**Preço (Novita AI)**|US$ 0,35 por 1M de entrada / US$ 1,50 por 1M de saída|US$ 0,60 por 1M de entrada / US$ 2,20 por 1M de saída|**Qwen3-Coder**|
|**Especialização**|70% dos dados de treinamento em código; otimizado para tarefas de codificação em larga escala|Mistura balanceada de raciocínio, codificação e tarefas agenticas|**Depende do caso de uso**|
|**Eficiência Geral**|Eficiente para custo e uso de contexto longo|Eficiente para hardware e velocidade|**Divisão: Qwen3 para custo/contexto, GLM 4.5 para computação/velocidade**|
> * O **GLM 4.5** é **mais eficiente em recursos** quando falamos de **hardware (VRAM, velocidade, latência)**.
> * O **Qwen3-Coder** é **mais eficiente** em termos de **custo por token e manipulação de contexto massivo**.
>
> 👉 Na prática:
>
> * Escolha o **GLM 4.5** se você se importa com **inferência mais rápida e carga de computação mais leve**.
> * Escolha o **Qwen3-Coder** se você precisar de **tokens mais baratos e janelas de contexto ultra longas** para bases de código grandes.
## Qwen3 Coder vs GLM 4.5: Qual é melhor para programação em Python?
|Aspecto|**Qwen3-Coder**|**GLM 4.5**|Recomendação|
|---|---|---|---|
|**Benchmarks de Codificação Python** (HumanEval, MBPP, LCB)|Desempenho forte; relatórios de usuários e avaliações sugerem domínio nos benchmarks padrão de Python|Também tem um bom desempenho, mas fica ligeiramente atrás na geração de código Python puro|**Qwen3-Coder**|
|**Tarefas Agénticas / Chamada de Ferramentas**|77,1%|90,6%|**GLM 4.5** — ideal para fluxos de trabalho que envolvem chamadas de API, ferramentas externas ou interações complexas|
|**Linguagens de Programação Suportadas**|Suporta **358 linguagens**, incluindo Python e linguagens obscuras/legadas — ótimo para casos de uso multilíngues ou de borda|Não há dados específicos sobre suporte multilíngue — presume-se que seja forte, mas menos abrangente|**Qwen3-Coder**|
|**Comprimento de Contexto**|256K tokens|Janela de 128K tokens|**Qwen3-Coder**|
|**Velocidade e Eficiência de Inferência**|Uso mais pesado de VRAM; inferência mais lenta devido ao requisito de 1050 GB|Mais leve (945 GB), mais rápido e mais eficiente em hardware|**GLM 4.5**|
> * **Escolha o Qwen3-Coder** se suas necessidades principais são:
> * Escrever ou refatorar código Python puro (ex.: notebooks, scripts, fluxos de trabalho de ML).
> * Trabalhar com **muitas linguagens ou linguagens de nicho** (suporta 358).
> * Lidar com **bases de código grandes** ou projetos Python que exigem contexto estendido (256K a 1M tokens).
> * Minimizar o **custo por token** — ótimo para iterações frequentes em Python.
> * **Escolha o GLM 4.5** se você precisar de:
> * **Integração confiável de ferramentas**, orquestração de APIs ou fluxos de trabalho agenticos com dependências externas.
> * **Inferência eficiente e de alta velocidade** no hardware fornecido.
> * Fortes capacidades de raciocínio para depuração, explicação ou tarefas de lógica Python passo a passo.
## Comparação do Qwen3 Coder e GLM 4.5 para Software
> Criar um jogo de Tetris
Qwen 3 Coder
GLM 4.5
> Construir uma página web interativa de Pokédex de Pokémon apresentando os primeiros 50 Pokémon, incluindo suas animações e tipos.

*GLM 4.5*

*Qwen 3 Coder*
## Como acessar o Qwen 3 Coder 480B A35B por ferramentas de CLI?
https://www.youtube.com/watch?v=hsPzLalRnpc
* **Mais rápido:** Você pode usar o Qwen3-Coder diretamente da linha de comando — nenhum site ou software extra necessário.
* **Automação mais fácil:** É simples escrever scripts que usam o Qwen3-Coder para tarefas de codificação.
* **Se adapta ao fluxo de trabalho de desenvolvedores:** A maioria dos desenvolvedores usa a linha de comando, então o Qwen3-Coder se torna uma parte natural do trabalho diário.
* **Fácil de escalar:** Você pode processar rapidamente muitos arquivos ou projetos usando comandos de CLI.
### Primeiro passo: Obtenha a chave de API
***Passo 1: Faça login na sua conta e clique no botão da Biblioteca de Modelos.***

[Experimente o modelo Qwen 3 Coder e o GLM 4.5 agora!](https://novita.ai/models/llm/qwen-qwen3-coder-480b-a35b-instruct)
***Passo 2: Escolha seu modelo***
Navegue pelas opções disponíveis e selecione o modelo que atende às suas necessidades.

***Passo 3: Inicie seu teste gratuito***
Comece seu teste gratuito para explorar as capacidades do modelo selecionado.

***Passo 4: Obtenha sua chave de API***
Para autenticar com a API, forneceremos uma nova chave de API para você. Acessando a página de “Configurações“, você pode copiar a chave de API conforme indicado na imagem.

***Passo 5: Instale a API***
Instale a API usando o gerenciador de pacotes específico da sua linguagem de programação.
Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o LLM da Novita AI. Este é um exemplo de uso da API de conclusões de chat para usuários de Python.
pip install ‘openai>=1.0.0’ from openai import OpenAI
client = OpenAI( base_url=“https://api.novita.ai/v3/openai”, api_key=“”, )
model = “qwen/qwen3-coder-480b-a35b-instruct” stream = True # or False max_tokens = 131072 system_content = ““Be a helpful assistant”” temperature = 1 top_p = 1 min_p = 0 top_k = 50 presence_penalty = 0 frequency_penalty = 0 repetition_penalty = 1 response_format = { “type”: “text” }
chat_completion_res = client.chat.completions.create( model=model, messages=[ { “role”: “system”, “content”: system_content, }, { “role”: “user”, “content”: “Hi there!”, } ], stream=stream, max_tokens=max_tokens, temperature=temperature, top_p=top_p, presence_penalty=presence_penalty, frequency_penalty=frequency_penalty, response_format=response_format, extra_body={ “top_k”: top_k, “repetition_penalty”: repetition_penalty, “min_p”: min_p } )
if stream: for chunk in chat_completion_res: print(chunk.choices[0].delta.content or “”, end=“”) else: print(chat_completion_res.choices[0].message.content)
## Qwen 3 Coder 480B A35B e GLM 4.5 com o [Trae](/access-novita-ai-llm-on-trae/)
#### ***Passo 1: Abra o Trae e acesse os Modelos***
Inicie o aplicativo Trae. Clique na Barra Lateral de IA no canto superior direito para abrir a Barra Lateral de IA. Em seguida, vá para Gerenciamento de IA e selecione Modelos.


#### ***Passo 2: Adicione um Modelo Personalizado e escolha a Novita como Provedor***
Clique no botão **Adicionar Modelo** para criar uma entrada de modelo personalizado. Na caixa de diálogo de adição de modelo, selecione **Provedor** = Novita no menu suspenso.


#### ***Passo 3: Selecione ou insira o Modelo***

No menu suspenso de Modelos, selecione o modelo desejado (DeepSeek-R1-0528, Kimi K2 DeepSeek-V3-0324 ou MiniMax-M1-80k). Se o modelo exato não estiver listado, basta digitar o ID do modelo que você anotou na biblioteca da Novita. Certifique-se de escolher a variante correta do modelo que deseja usar.
Você pode obter a chave de API no [Console da Novita!](https://novita.ai/docs/guides/introduction)
## Qwen 3 Coder 480B A35B e GLM 4.5 com o [Qwen Code](/qwen-code/)
> O Qwen Code é desenvolvido sobre o Gemini Code, mas adaptamos os prompts e os protocolos de chamada de ferramentas para maximizar o desempenho do Qwen3-Coder em tarefas de codificação agenticas.
#### *Passo 1: Instale o Qwen Code*
**Pré-requisitos:** Certifique-se de ter o Node.js versão 20 ou superior instalado. Você pode baixá-lo no [site oficial do Node.js](https://nodejs.org/).
**Instale o pacote globalmente:**
npm install -g @qwen-code/qwen-code
#### *Passo 2: Configure as Variáveis de Ambiente*
**Para Windows (Prompt de Comando):**
set OPENAI_API_KEY=Your_Novita_API_Key set OPENAI_BASE_URL=https://api.novita.ai/v3/openai set OPENAI_MODEL=qwen/qwen3-coder-480b-a35b-instruct
**Para Linux e Mac (Bash):**
export OPENAI_API_KEY=“Your_Novita_API_Key” export OPENAI_BASE_URL=“https://api.novita.ai/v3/openai” export OPENAI_MODEL=“qwen/qwen3-coder-480b-a35b-instruct”
#### *Passo 3: Comece a Codificar*
Uma vez configurado, você pode começar a usar o Qwen Code com o modelo da Novita AI escolhido. A ferramenta agora utilizará o modelo especificado para todas as tarefas de assistência de codificação.
cd
Em tarefas de codificação, ambos os modelos se destacam — mas de maneiras diferentes:
* O **Qwen3-Coder** é a escolha mais forte para **desempenho de codificação pura**: escrever e refatorar Python, suportar linguagens de nicho e lidar com bases de código massivas graças ao seu **contexto de 256K a 1M tokens** e custos de token mais baixos.
* O **GLM-4.5** se destaca quando a **codificação se cruza com raciocínio e integração**: é mais rápido de executar, mais eficiente em recursos e domina em **chamada de ferramentas**, tornando-o ideal para ambientes de programação agenticos.
👉 Se você está construindo **software dentro de bases de código enormes**, escolha o **Qwen3-Coder**.
👉 Se você está construindo **agentes de codificação inteligentes ou aplicativos orientados a API**, escolha o **GLM-4.5**.
#### Perguntas Frequentes
**Qual modelo é melhor para programação em Python?**
O Qwen3-Coder lidera nos benchmarks padrão de Python (HumanEval, MBPP, LiveCodeBench) e é geralmente preferido para notebooks, fluxos de trabalho de ML e automação de scripts.
**Qual modelo é melhor para código multilíngue ou legado?**
O Qwen3-Coder suporta **358 linguagens de programação**, tornando-o melhor para cenários de desenvolvimento diversificados ou de casos de borda.
**Qual modelo lida com depuração e fluxos de trabalho em escala de repositório?**
O Qwen3-Coder se destaca em depuração multi-turno, edições de código grandes e tarefas em escala de repositório devido ao seu contexto ultra longo (256K a 1M tokens).
> *[A Novita AI](https://novita.ai/) é a plataforma de nuvem tudo-em-um que capacita suas ambições de IA. APIs integradas, serverless, Instâncias de GPU — as ferramentas custo-efetivas que você precisa. Elimine a infraestrutura, comece gratuitamente e torne sua visão de IA uma realidade.*
#### **Leitura Recomendada**
[Llama 3.2 3B vs DeepSeek V3: Comparando Eficiência e Desempenho](/llama-3-2-3b-vs-deepseek-v3/).
[Como acessar o ERNIE 4.5: Maneiras fáceis via Web, API e Código](/how-to-access-ernie-4-5-effortless-ways-via-web-api-and-code/)
[Acesse o DeepSeek V3.1 no Trae: Guia completo de configuração e integração](/access-deepseek-v3-1-in-trae-complete-setup-and-integration-guide/)
