ERNIE-4.5-21B-A3B-Thinking ya está disponible en la plataforma Novita AI, llevando las capacidades de pensamiento innovadoras de Baidu a desarrolladores y empresas a través de nuestra infraestructura amigable para desarrolladores. Esta última versión de Baidu representa un avance significativo en los modelos de IA ligeros, introduciendo una profundidad y calidad de razonamiento mejoradas que lo distinguen de generaciones anteriores.
Con su arquitectura eficiente de Mezcla de Expertos (MoE) que activa solo 3B de parámetros por token de un total de 21B parámetros, ERNIE-4.5-21B-A3B-Thinking ofrece un rendimiento de gama alta con requisitos de recursos ligeros.
Tanto si estás desarrollando aplicaciones de razonamiento complejo, creando solucionadores matemáticos o explorando capacidades avanzadas de IA, ERNIE-4.5-21B-A3B-Thinking en Novita AI simplifica el proceso de desarrollo con nuestra infraestructura optimizada y opciones de integración sencillas.
Precio actual en Novita AI: 131.072 tokens de contexto, $0,07 por 1M de tokens de entrada, $0,28 por 1M de tokens de salida
Prueba la demostración de ERNIE-4.5-21B-A3B-Thinking
¿Qué es ERNIE-4.5-21B-A3B-Thinking?
ERNIE-4.5-21B-A3B-Thinking es un modelo de postentrenamiento de Mezcla de Expertos (MoE) basado en texto de la innovadora serie ERNIE 4.5 de Baidu, que comprende 10 modelos diferentes. Este modelo representa una evolución significativa en las capacidades de pensamiento de la IA, con 21B de parámetros totales, de los cuales solo se activan 3B por token.
El modelo introduce tres mejoras clave sobre versiones anteriores:
Capacidades de pensamiento mejoradas: ERNIE-4.5-21B-A3B-Thinking ofrece un rendimiento significativamente superior en tareas de razonamiento, que incluyen razonamiento lógico, matemáticas, ciencias, programación, generación de texto y puntos de referencia académicos que normalmente requieren experiencia humana. El modelo cuenta con una longitud de pensamiento aumentada, lo que lo hace especialmente eficaz para tareas de razonamiento altamente complejas.
Utilización eficiente de herramientas: El modelo demuestra capacidades excepcionales en el uso de herramientas y llamadas a funciones, lo que lo hace ideal para aplicaciones basadas en agentes. Esto permite una integración perfecta con sistemas y API externos para aplicaciones del mundo real.
Comprensión extendida de contexto: Con sus capacidades mejoradas de comprensión de contexto largo de 128K (131.072 tokens), ERNIE-4.5-21B-A3B-Thinking puede procesar documentos extensos, bases de código y conversaciones de múltiples turnos complejas sin perder contexto ni precisión.
ERNIE-4.5-21B-A3B-Thinking utiliza técnicas avanzadas de postentrenamiento que incluyen SFT (Ajuste Fino Supervisado), DPO (Optimización Directa de Preferencias) y la UPO (Optimización Unificada de Preferencias) propietaria de Baidu. El modelo publica pesos de estilo Transformer para alinearse con la comunidad más amplia, garantizando compatibilidad con los ecosistemas de PyTorch y PaddlePaddle, incluyendo vLLM y FastDeploy. Esta amplia compatibilidad facilita su integración en flujos de trabajo existentes, manteniendo la eficiencia computacional con un requisito de solo 80 GB × 1 GPU.
Explora ERNIE-4.5-21B-A3B-Thinking en el patio de juegos de Novita AI →
Especificaciones del modelo
ERNIE-4.5-21B-A3B-Thinking emplea una arquitectura sofisticada de Mezcla de Expertos optimizada tanto para rendimiento como para eficiencia. El diseño del modelo permite la activación selectiva de los expertos más relevantes para cada token, logrando un equilibrio óptimo entre capacidad y coste computacional.
Especificaciones principales:
- Parámetros totales: 21B
- Parámetros activados: 3B por token
- Capas: 28
- Cabezas de atención: 20 cabezas de consulta / 4 cabezas de clave-valor
- Expertos de texto: 64 en total / 6 activados por token
- Expertos compartidos: 2
- Longitud de contexto: 131.072 tokens
- Salida máxima: 65.536 tokens
- Capacidades de entrada/salida: Texto
- Etapa de entrenamiento: Postentrenamiento
- Proveedor: Baidu
- Licencia: Apache 2.0
- Cuantización: FP8
- Requisito de GPU: 80 GB × 1 GPU
- Soporte de razonamiento: Sí
La arquitectura MoE de ERNIE-4.5-21B-A3B-Thinking representa un avance en el diseño eficiente de IA, heredando innovaciones de la serie ERNIE 4.5 más amplia, incluyendo técnicas de enrutamiento de modalidad aislada y pérdida de ortogonalidad del enrutador. Al activar solo 3B de parámetros por token mientras mantiene acceso a 21B de parámetros totales, el modelo ofrece un rendimiento de nivel empresarial sin la sobrecarga computacional típica.
La ventana de contexto de 131.072 tokens y la capacidad de salida de 65.536 tokens del modelo permiten procesar documentos extensos y generar respuestas completas, lo que lo hace ideal para tareas analíticas complejas, generación de contenido largo y documentación técnica detallada.
Aspectos destacados de rendimiento
ERNIE-4.5-21B-A3B-Thinking demuestra un rendimiento excepcional en múltiples dominios, logrando resultados de vanguardia (SOTA) como parte de la familia ERNIE 4.5. Las capacidades de pensamiento mejoradas y la profundidad de razonamiento mejorada del modelo lo hacen especialmente eficaz para tareas que requieren análisis de múltiples pasos y resolución de problemas complejos.

Las principales fortalezas de rendimiento incluyen:
- Razonamiento lógico: ERNIE-4.5-21B-A3B-Thinking destaca en tareas complejas de deducción lógica, demostrando un rendimiento superior en acertijos, silogismos y problemas de razonamiento de múltiples pasos que requieren un análisis cuidadoso y pensamiento sistemático.
- Matemáticas: El modelo muestra capacidades avanzadas de resolución de problemas matemáticos, manejando desde aritmética básica hasta cálculo complejo, álgebra lineal y conceptos matemáticos abstractos con alta precisión.
- Ciencias: Las capacidades mejoradas de razonamiento y análisis científico permiten a ERNIE-4.5-21B-A3B-Thinking abordar problemas de física, química, biología y otros dominios científicos, proporcionando explicaciones detalladas y soluciones precisas.
- Programación: Con capacidades mejoradas de generación y depuración de código en múltiples lenguajes de programación, el modelo puede escribir, analizar y optimizar código, además de proporcionar explicaciones claras de conceptos de programación y buenas prácticas.
- Generación de texto: La generación de lenguaje natural de alta calidad hace que ERNIE-4.5-21B-A3B-Thinking sea ideal para escritura creativa, documentación técnica y tareas de creación de contenido que requieren una comprensión y expresión matizadas.
- Puntos de referencia académicos: El modelo logra un rendimiento competitivo en puntos de referencia que requieren experiencia de nivel humano, demostrando su preparación para aplicaciones profesionales y académicas.
Prueba las capacidades de ERNIE-4.5-21B-A3B-Thinking en el patio de juegos de Novita AI →
Primeros pasos con ERNIE-4.5-21B-A3B-Thinking en la plataforma Novita AI
Novita AI proporciona múltiples vías de acceso a ERNIE-4.5-21B-A3B-Thinking, adaptadas a diferentes niveles de experiencia técnica y casos de uso. Tanto si eres un usuario empresarial que explora las capacidades de la IA como un desarrollador que crea aplicaciones de producción, nuestra plataforma ofrece las herramientas y la flexibilidad que necesitas.
Usa el patio de juegos (Disponible ahora – Sin necesidad de código)
El patio de juegos de Novita AI ofrece la forma más rápida de experimentar las capacidades de ERNIE-4.5-21B-A3B-Thinking sin necesidad de configuración técnica:
Acceso instantáneo: Regístrate y comienza a experimentar con ERNIE-4.5-21B-A3B-Thinking en segundos. No se requieren claves de API ni configuración para las pruebas iniciales.
Interfaz interactiva: Prueba indicaciones y visualiza resultados en tiempo real con nuestra interfaz web intuitiva. Ajusta parámetros como la temperatura (valor predeterminado 0,7), tokens máximos (hasta 65.536) e indicaciones del sistema para ver cómo afectan al comportamiento del modelo.
Configuración del modelo: Ajusta el formato de respuesta, temperatura, top-p, min-p, top-k, penalización de presencia, penalización de frecuencia y penalización de repetición para optimizar los resultados para tu caso de uso específico.
El patio de juegos es perfecto para prototipado, prueba de ideas y comprensión de las capacidades del modelo antes de la implementación completa. Exporta tus indicaciones y configuraciones exitosas directamente a código para una transición sin problemas a producción.
Comienza a probar ERNIE-4.5-21B-A3B-Thinking en el patio de juegos →
Integración vía API (En vivo y lista – Para desarrolladores)
Para despliegues en producción, Novita AI ofrece acceso API robusto a ERNIE-4.5-21B-A3B-Thinking con fiabilidad y rendimiento de nivel empresarial a través de endpoints compatibles con OpenAI.
Integración API directa (Ejemplo en Python)
Conecta ERNIE-4.5-21B-A3B-Thinking a tus aplicaciones utilizando nuestra API compatible con OpenAI:
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key="",
)
model = "baidu/ernie-4.5-21B-a3b-thinking"
stream = True # or False
max_tokens = 32768
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Soporte adicional de SDK disponible para TypeScript, Java, Go y Shell para una integración perfecta en diferentes pilas tecnológicas.
Flujos de trabajo multiagente con SDK de Agentes de OpenAI
Construye sistemas multiagente sofisticados que aprovechen las capacidades de pensamiento mejoradas de ERNIE-4.5-21B-A3B-Thinking:
- Integración lista para usar: Utiliza ERNIE-4.5-21B-A3B-Thinking en cualquier flujo de trabajo de Agentes de OpenAI sin modificaciones
- Capacidades avanzadas de agentes: Soporte completo para transferencias, enrutamiento e integración de herramientas para flujos de trabajo complejos
- Llamada a funciones: Aprovecha las definiciones de JsonSchema para interacciones estructuradas y uso de herramientas
Opciones de despliegue
Novita AI ofrece opciones de despliegue flexibles para adaptarse a tus requisitos y patrones de uso específicos.
API sin servidor
ERNIE-4.5-21B-A3B-Thinking está disponible a través de la API sin servidor de Novita para acceso inmediato y precios por token:
- Sin configuración requerida: Comienza a usar el modelo al instante sin gestión de infraestructura
- Precios por uso: $0,07 por 1M de tokens de entrada, $0,28 por 1M de tokens de salida
- Endpoints compatibles con OpenAI: Sustitución directa para integraciones existentes de OpenAI
- Escalado automático: Gestiona cargas de trabajo variables sin planificación de capacidad
Despliegues bajo demanda
Para aplicaciones de alto volumen o sensibles a la latencia, los despliegues bajo demanda proporcionan recursos dedicados:
- Pila de servicio de alto rendimiento: Motor de inferencia optimizado para máximo rendimiento
- Alta fiabilidad: Los recursos de GPU dedicados garantizan un rendimiento constante
- Sin límites de tasa: Escala según tus necesidades sin restricciones artificiales
- Requisitos de GPU: 80 GB de VRAM (recomendado: NVIDIA A100 80GB o H100 80GB para un rendimiento óptimo)
Conéctate con plataformas de terceros
ERNIE-4.5-21B-A3B-Thinking en Novita AI se integra perfectamente con tu ecosistema de desarrollo existente:
Herramientas de desarrollo: Integración directa con IDE y entornos de desarrollo populares como Cursor, Cline, Continue, Codex y Qwen Code a través de API compatibles con OpenAI.
Marcos de orquestación: Soporte nativo para LangChain, Dify, CrewAI, Langflow y otras plataformas de orquestación de IA mediante conectores oficiales.
Integración con Hugging Face: Como proveedor de inferencia oficial de Hugging Face, Novita AI garantiza una amplia compatibilidad con el ecosistema y un despliegue sencillo de modelos.
Conclusión
ERNIE-4.5-21B-A3B-Thinking en Novita AI representa un avance en el razonamiento eficiente de IA, proporcionando a desarrolladores y organizaciones acceso a las capacidades de pensamiento más avanzadas de Baidu a través de nuestra plataforma fiable y escalable.
La combinación única del modelo de profundidad de razonamiento mejorada, utilización eficiente de herramientas y comprensión de contexto de 131K lo convierte en la opción ideal para tareas de razonamiento complejo. Con solo 3B de parámetros activos que ofrecen un rendimiento de 21B parámetros y requiriendo solo 80 GB de memoria GPU, ERNIE-4.5-21B-A3B-Thinking ofrece un equilibrio sin igual entre capacidad y eficiencia.
¿Listo para experimentar el poder de ERNIE-4.5-21B-A3B-Thinking? Nuestro patio de juegos proporciona acceso instantáneo sin necesidad de configuración, perfecto para explorar las capacidades del modelo y probar tus casos de uso. Comienza con nuestra interfaz interactiva para comprender las fortalezas del modelo, luego transiciona sin problemas a la integración por API cuando estés listo para el despliegue en producción.
Accede a ERNIE-4.5-21B-A3B-Thinking en el patio de juegos de Novita AI ahora →
Transforma tus proyectos con razonamiento avanzado de IA por solo $0,07 por millón de tokens de entrada. ¡Comienza a explorar en segundos!
Novita AI es una plataforma de nube de IA que ofrece a los desarrolladores una forma sencilla de desplegar modelos de IA mediante nuestra API simple, además de proporcionar una nube de GPU asequible y fiable para construir y escalar.
