Los desarrolladores que crean asistentes de codificación agénticos se enfrentan a una decisión clave: pagar entre 3 y 15 dólares por cada millón de tokens de salida por modelos cerrados como Claude Sonnet 4.5, o pasarse a modelos de razonamiento abiertos que prometen capacidades similares a una fracción del coste. Qwen3-235B-A22B-Thinking-2507 de Alibaba desafía esta disyuntiva ofreciendo rendimiento de razonamiento con un modo de pensamiento dedicado, todo ello por solo 0,30/3,00 dólares por cada millón de tokens de entrada/salida a través de Novita AI.
Esta guía explica cómo integrar Qwen3-235B-A22B-Thinking-2507 en Claude Code, el agente de terminal compatible con Anthropic que permite flujos de trabajo de codificación agénticos. Verás cómo este modelo MoE de 235B (22B parámetros activos por token) aprovecha el entorno enriquecido con herramientas de Claude Code para automatizar tareas de codificación complejas con trazas de razonamiento extendido.
¡Prueba Qwen3-235B-A22B-Thinking-2507 ahora!
¿Ofrece Qwen3-235B-A22B-Thinking-2507 un verdadero poder de razonamiento?
Qwen3-235B-A22B-Thinking-2507 es el modelo más reciente con capacidad de pensamiento de la línea Qwen3, que ofrece importantes avances en capacidad de razonamiento. Destaca en la resolución de problemas lógicos, matemáticas, análisis científico, codificación y evaluaciones académicas, alcanzando o superando el rendimiento a nivel de experto humano y ofreciendo un rendimiento competitivo entre los modelos de razonamiento de código abierto. Además de sus puntos fuertes en razonamiento, ofrece capacidades generales mejoradas, que incluyen un seguimiento de instrucciones más preciso, integración avanzada de herramientas, generación de texto altamente natural y una mejor alineación con la intención humana. El modelo también admite un contexto extendido de 131K tokens, lo que permite un manejo coherente y profundo de documentos largos y debates complejos.
Arquitectura y capacidades
| Parámetro técnico | Especificación | Descripción |
|---|---|---|
| Tipo de modelo | Modelo de lenguaje causal | Basado en arquitectura Transformer |
| Parámetros totales | 235B | 22B parámetros activados |
| Parámetros no incrustados | 234B | Parámetros computacionales reales |
| Número de capas | 94 capas | Estructura de red neuronal profunda |
| Cabezas de atención | Q: 64, KV: 4 | Usa mecanismo GQA |
| Número de expertos | 128 | Diseño de arquitectura MoE |
| Expertos activados | 8 | Selección dinámica de expertos |
| Longitud de contexto | 262,144 tokens | Soporte nativo de contexto largo |
Rendimiento en benchmarks (tareas de razonamiento)

De Hugging Face
Qwen3-235B-A22B-Thinking-2507 sobresale en tareas con gran carga de razonamiento y conocimiento, especialmente matemáticas, conocimiento multilingüe y comprensión de documentos/vídeos. Su rendimiento es consistentemente competitivo con modelos más grandes en benchmarks cognitivos y de comprensión complejos.
Eficiencia de costes y tokens
A 0,30 dólares por cada millón de tokens de entrada y 3,00 dólares por cada millón de tokens de salida, Qwen3-235B-A22B-Thinking-2507 ofrece un ahorro del 90 % en entrada y del 80 % en salida en comparación con Claude Sonnet 4.5 (3/15 dólares por cada millón de tokens). Para tareas de razonamiento extendido, el modelo puede generar hasta 81K tokens, lo que significa que una sola tarea compleja podría costar 0,24 dólares en tokens de salida, frente a 1,22 dólares con Claude.

¡Prueba Qwen3-235B-A22B-Thinking-2507 ahora!
Por qué Qwen3-235B-A22B-Thinking-2507 funciona mejor con Claude Code
Claude Code es una interfaz de codificación agéntica basada en terminal publicada por Anthropic. Orquesta flujos de trabajo de varios pasos invocando herramientas (edición de archivos, comandos bash, búsqueda), gestionando el contexto entre tareas e iterando en función de la retroalimentación. Las trazas de razonamiento explícitas de Qwen3-235B-A22B-Thinking-2507 se alinean perfectamente con este paradigma agéntico: el modelo muestra sus pasos de planificación antes de ejecutar llamadas a herramientas, lo que hace que los flujos de trabajo complejos sean depurables y transparentes.
1. Optimizado para interacciones agénticas
Qwen3-235B-A22B-Thinking-2507 está diseñado para realizar acciones, usar herramientas y gestionar tareas de varios pasos. Su modo de pensamiento genera cadenas de razonamiento estructuradas que coinciden con la expectativa de Claude Code de flujos de trabajo planificar → ejecutar → verificar. Cuando el modelo planifica una refactorización en 5 archivos, ves el razonamiento paso a paso antes de que se realice cualquier edición en los archivos.
2. Cadenas de herramientas enriquecidas y soporte de API
Claude Code proporciona acceso preconfigurado a operaciones del sistema de archivos, ejecución de bash, búsqueda grep, comandos git e integraciones de herramientas externas. Los modelos Qwen3 admiten esquemas de llamada a herramientas, modo JSON y definiciones de funciones, lo que permite una invocación fluida del conjunto de herramientas de Claude Code para tareas como pruebas automatizadas, scripts de despliegue y refactorización de múltiples archivos.
3. Bucles de retroalimentación en tiempo real
El modo de pensamiento del modelo permite una depuración adaptativa: si falla una llamada a herramienta (p. ej., errores en la suite de pruebas), la traza de razonamiento muestra lo que asumió el modelo, lo que te permite corregir conceptos erróneos durante la sesión. Esto es crítico para flujos de trabajo agénticos donde los errores tempranos se propagan a lo largo de 20+ pasos.
4. Salida extendida para razonamiento complejo
Tareas de Claude Code como “refactorizar el flujo de autenticación en 8 archivos” o “depurar una fuga de memoria con integración de profiler” requieren planes de varios pasos con salidas de 10K+ tokens. Qwen3-235B-A22B-Thinking-2507 admite hasta 81K tokens para razonamiento complejo, superando con creces los límites estándar del modelo, manteniendo los costes manejables (0,24 dólares por 81K de salida frente a 1,22 dólares de Claude).
Cómo usar Qwen3-235B-A22B-Thinking-2507 con Claude Code
Novita AI proporciona un endpoint de API compatible con Anthropic, lo que significa que Claude Code funciona con Qwen3-235B-A22B-Thinking-2507 mediante una simple configuración de variables de entorno, sin necesidad de cambios en el código. La ventana de contexto de 256K y el precio de 0,30/3,00 dólares por cada millón de tokens de entrada/salida lo hacen ideal para sesiones de codificación prolongadas.
Requisitos previos: Obtén tu clave API de Novita AI
Paso 1: Crea una cuenta gratuita en Novita AI e inicia sesión.
Paso 2: Ve a la Biblioteca de modelos y busca qwen/qwen3-235b-a22b-thinking-2507.
Paso 3: Haz clic en Iniciar prueba gratuita para activar el acceso (Novita proporciona créditos de prueba para nuevos usuarios).
Paso 4: Ve a Configuración → Claves API y haz clic en Generar clave API. Copia la clave.
Paso 5: Verifica la conexión API con esta prueba en Python:
from openai import OpenAI
client = OpenAI(
api_key="<Tu Clave API>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="qwen/qwen3-235b-a22b-thinking-2507",
messages=[
{"role": "system", "content": "Eres un asistente útil."},
{"role": "user", "content": "Hola, ¿cómo estás?"}
],
max_tokens=32768,
temperature=0.7
)
print(response.choices[0].message.content)
Deberías ver la respuesta del modelo con trazas de razonamiento encerradas entre etiquetas thinking.
¡Prueba Qwen3-235B-A22B-Thinking-2507 ahora!
Guía de configuración de Claude Code
Paso 1: Instalar Claude Code
#macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash
#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex
#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd
Windows requiere Git para Windows. Instálalo primero si no lo tienes.
Paso 2: Configurar las variables de entorno
Claude Code utiliza 4 variables de entorno para enrutar las solicitudes API a Novita AI:
#Para macOS/Linux (Bash/Zsh):
# Establece el endpoint de API compatible con Anthropic SDK proporcionado por Novita.
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Clave API de Novita>"
# Establece el modelo proporcionado por Novita.
export ANTHROPIC_MODEL="qwen/qwen3-235b-a22b-thinking-2507"
export ANTHROPIC_SMALL_FAST_MODEL="qwen/qwen3-235b-a22b-thinking-2507"
#Para Windows (PowerShell):
$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "Clave API de Novita"
$env:ANTHROPIC_MODEL = "qwen/qwen3-235b-a22b-thinking-2507"
$env:ANTHROPIC_SMALL_FAST_MODEL = "qwen/qwen3-235b-a22b-thinking-2507"
Explicación:
ANTHROPIC_BASE_URL: Apunta Claude Code al endpoint compatible con Anthropic de NovitaANTHROPIC_AUTH_TOKEN: Tu clave API de Novita (no una clave de Anthropic)ANTHROPIC_MODEL: Modelo principal para tareas complejas (modo de pensamiento)ANTHROPIC_SMALL_FAST_MODEL: Modelo de respaldo para operaciones rápidas (configúralo al mismo modelo si deseas un comportamiento de razonamiento consistente)
Paso 3: Iniciar Claude Code
Navega al directorio de tu proyecto e inicia Claude Code:
cd <tu-directorio-del-proyecto>
claude .
Verás el prompt de Claude Code dentro de una sesión interactiva. El modo de pensamiento del modelo se activa automáticamente para consultas complejas.
Ejemplo de tarea:
> Refactoriza el módulo de autenticación para usar tokens JWT en lugar de sesiones. Actualiza los 5 archivos relacionados y añade pruebas unitarias.
Claude Code analizará la solicitud, invocará a Qwen3-235B-A22B-Thinking-2507 para generar un plan de varios pasos (visible en bloques thinking), luego ejecutará ediciones de archivos, escribirá pruebas y verificará los cambios.
Consejo profesional: Para tareas con gran carga matemática o de diseño de algoritmos, aumenta
max_tokensa 131072 en tus llamadas API para aprovechar la capacidad de razonamiento extendido de Qwen3-235B-A22B-Thinking-2507. Configúralo a través de la configuración de Claude Code si expone límites de tokens.
¡Prueba Qwen3-235B-A22B-Thinking-2507 ahora!
Qwen3-235B-A22B-Thinking-2507 ofrece razonamiento avanzado, manejo de contexto largo y planificación estructurada de múltiples pasos a una fracción del coste de los modelos cerrados. Combinado con Claude Code, permite flujos de trabajo de codificación agénticos transparentes y depurables, lo que lo convierte en una solución práctica para desarrolladores que buscan razonamiento de alto rendimiento y automatización de codificación sin gastos prohibitivos en tokens.
Conclusión
Qwen3-235B-A22B-Thinking-2507 aporta razonamiento extendido, salida de cadena de pensamiento transparente y sólidas capacidades de uso de herramientas al flujo de trabajo agéntico de Claude Code, a una fracción del coste de los modelos cerrados. Para los desarrolladores que realizan tareas de codificación complejas, la combinación ofrece tanto rendimiento como eficiencia presupuestaria.
Conclusión clave: Configura cuatro variables de entorno, apunta Claude Code al endpoint compatible con Anthropic de Novita AI y estarás ejecutando flujos de trabajo de razonamiento avanzado en cuestión de minutos. Prueba Qwen3-235B-A22B-Thinking-2507 en Novita AI y comienza a desarrollar hoy.
¿Qué hace diferente a Qwen3-235B-A22B-Thinking-2507 de los modelos de codificación estándar?
Es un modelo exclusivo de pensamiento que genera trazas de razonamiento estructuradas en bloques thinking antes de generar código, lo que hace que los flujos de trabajo agénticos complejos sean transparentes y depurables. A diferencia de los modelos de instrucción generales, está optimizado exclusivamente para tareas con gran carga de razonamiento, como programación competitiva, diseño de algoritmos y depuración de múltiples pasos.
¿Puedo usar Qwen3-235B-A22B-Thinking-2507 en herramientas que no sean Claude Code?
Sí: funciona con cualquier herramienta que admita APIs compatibles con OpenAI. Trae (IDE con GUI), OpenCode (agente de terminal), Cursor (editor de código) y scripts personalizados en Python/Node.js lo admiten a través del endpoint https://api.novita.ai/v3/openai de Novita AI.
¿Necesito una GPU para ejecutar Qwen3-235B-A22B-Thinking-2507 localmente?
Sí: se estima que se necesitan 4×H100 de 80GB para FP8. Para la mayoría de los desarrolladores, la API de Novita AI es más rentable que el autoalojamiento, a menos que ejecutes 10 000+ tareas al mes.
Lecturas recomendadas
- Usa GLM-4.5 en Trae para desbloquear agentes de codificación más inteligentes
- Usa Codex CLI con Novita AI
- Usa MiniMax M2.1 en OpenCode
Novita AI es una plataforma en la nube de IA y agentes que ayuda a desarrolladores y startups a construir, desplegar y escalar modelos y aplicaciones agénticas con alto rendimiento, fiabilidad y eficiencia de costes.
