Como Usar o CoBuddy no Claude Code via Novita AI
Guia passo a passo para configurar o CoBuddy (baidu/cobuddy) no Claude Code usando o endpoint compatível com OpenAI da Novita AI. Configuração de API, preços e dicas de fluxo...
Guia passo a passo para configurar o CoBuddy (baidu/cobuddy) no Claude Code usando o endpoint compatível com OpenAI da Novita AI. Configuração de API, preços e dicas de fluxo...
O Nemotron 3 Nano 30B A3B está disponível na Novita AI como um LLM Serverless com chat completions compatível com OpenAI, contexto de 256K e precificação por token conforme o uso.
CoBuddy está disponível na Novita AI como uma API de LLM focada em codificação para geração de código, assistentes de codificação e fluxos de trabalho de agentes de IA.
Use o MiniMax M3 no Novita AI para codificação, fluxos de trabalho agenticos, contexto de 1 milhão de tokens e entrada multimodal com APIs compatíveis com OpenAI.
O Qwen3.7-Max está disponível na Novita AI para codificação agente e fluxos de trabalho de contexto longo. Veja acesso à API, preços, limites e casos de uso.
O cache KV externo do PegaFlow ajuda equipes de serving vLLM a preservar e compartilhar o cache KV entre reinicializações, instâncias e nós RDMA.
Ling-2.6-flash é um modelo MoE de 104B (7.4B ativos) que oferece 340 tokens/s e eficiência de tokens 7x melhor que o Nemotron-3-Super em benchmarks de agentes. Disponível agora...
O Kimi K2.6 já está na Novita AI. Modelo open-source MoE de 1T, contexto de 256K, 58,6% no SWE-Bench Pro — construído para codificação agentica de longo horizonte. Experimente...
O GLM-5.1, da Z.ai, já está disponível na Novita AI — lidera o benchmark SWE-Bench Pro com 58,4 pontos e executa tarefas de codificação autônomas por até 8 horas. Teste com...
O Gemma 4 já está disponível na Novita AI — 4 tamanhos de modelo, 3 arquiteturas, suporte a visão em toda a linha e suporte a áudio nos modelos E2B e E4B.
Explore o MiniMax Speech 2.5, uma solução para clonagem de voz de alta precisão com tempos de resposta rápidos e suporte multilíngue.
Experimente o MiniMax Speech-2.6 na Novita AI com resposta mais rápida, qualidade de voz realista e cobertura de idiomas global para qualquer cenário de voz.
Ganhe 20% de desconto em APIs de LLM, GPUs e Agent Sandbox até 31 de dezembro. Acesse mais de 200 modelos de IA, instâncias RTX 4090/5090 e infraestrutura de agentes autônomos.
Acesse o Kimi-K2-Thinking na Novita AI — um modelo de raciocínio open-source com trilhões de parâmetros, contexto de 256K, mais de 200 chamadas de ferramentas e desempenho de...