ERNIE-4.5-21B-A3B-Thinking теперь доступна на платформе Novita AI, предоставляя разработчикам и компаниям передовые возможности рассуждений от Baidu через нашу удобную для разработчиков инфраструктуру. Этот последний релиз от Baidu представляет собой значительный прорыв в области легковесных ИИ-моделей, предлагая улучшенную глубину и качество рассуждений, что отличает её от предыдущих поколений.
Благодаря эффективной архитектуре Mixture-of-Experts (MoE), активирующей всего 3B параметров на каждый токен из общего числа в 21B параметров, ERNIE-4.5-21B-A3B-Thinking обеспечивает производительность уровня тяжелых моделей при минимальных требованиях к ресурсам.
Независимо от того, разрабатываете ли вы сложные приложения для рассуждений, создаете математические решатели или изучаете продвинутые возможности ИИ, ERNIE-4.5-21B-A3B-Thinking на Novita AI упрощает процесс разработки благодаря нашей оптимизированной инфраструктуре и простым вариантам интеграции.
Текущие тарифы на Novita AI: 131072 токенов контекста, $0.07 за 1M входных токенов, $0.28 за 1M выходных токенов
Попробуйте демо-версию ERNIE-4.5-21B-A3B-Thinking
Что такое ERNIE-4.5-21B-A3B-Thinking?
ERNIE-4.5-21B-A3B-Thinking — это текстовая модель пост-обучения на архитектуре Mixture of Experts (MoE) из революционной серии ERNIE 4.5 от Baidu, которая включает 10 различных моделей. Эта модель представляет собой значительную эволюцию в возможностях ИИ-рассуждений, имея 21B общих параметров, из которых активируется только 3B на каждый токен.
Модель предлагает три ключевых улучшения по сравнению с предыдущими версиями:
Улучшенные возможности рассуждений: ERNIE-4.5-21B-A3B-Thinking показывает значительно более высокую производительность на задачах на рассуждения, включая логические рассуждения, математику, науку, программирование, генерацию текста и академические бенчмарки, которые обычно требуют экспертных знаний человека. Модель имеет увеличенную длину рассуждений, что делает её особенно эффективной для высокосложных задач на рассуждения.
Эффективное использование инструментов: Модель демонстрирует исключительные возможности в использовании инструментов и вызове функций, что делает её идеальным выбором для агентных приложений. Это обеспечивает бесшовную интеграцию с внешними системами и API для реальных приложений.
Расширенные возможности понимания контекста: Благодаря улучшенным возможностям понимания длинного контекста на 128K токенов (131072 токена), ERNIE-4.5-21B-A3B-Thinking может обрабатывать большие документы, кодовые базы и сложные многоходовые диалоги без потери контекста или точности.
ERNIE-4.5-21B-A3B-Thinking использует продвинутые техники пост-обучения, включая SFT (Supervised Fine-Tuning, обучение с учителем с тонкой настройкой), DPO (Direct Preference Optimization, прямая оптимизация предпочтений) и проприетарную технологию Baidu UPO (Unified Preference Optimization, унифицированная оптимизация предпочтений). Модель поставляется с весами в стиле Transformer для соответствия широкому сообществу, что обеспечивает совместимость как с экосистемой PyTorch, так и PaddlePaddle, включая vLLM и FastDeploy. Эта широкая совместимость упрощает интеграцию в существующие рабочие процессы при сохранении вычислительной эффективности и требовании всего одного GPU с объемом памяти 80GB.
Испытайте ERNIE-4.5-21B-A3B-Thinking в песочнице Novita AI →
Спецификации модели
ERNIE-4.5-21B-A3B-Thinking использует сложную архитектуру Mixture-of-Experts, оптимизированную как для производительности, так и для эффективности. Дизайн модели позволяет выборочно активировать наиболее релевантных экспертов для каждого токена, достигая оптимального баланса между возможностями и вычислительными затратами.
Основные спецификации:
- Общее количество параметров: 21B
- Активируемые параметры: 3B на токен
- Количество слоев: 28
- Головы внимания: 20 голов запросов / 4 головы ключ-значение
- Текстовые эксперты: 64 всего / 6 активируется на токен
- Общие эксперты: 2
- Длина контекста: 131072 токенов
- Максимальный вывод: 65536 токенов
- Возможности ввода/вывода: Текст
- Этап обучения: Пост-обучение
- Провайдер: Baidu
- Лицензия: Apache 2.0
- Квантизация: FP8
- Требования к GPU: 80GB × 1 GPU
- Поддержка рассуждений: Да
Архитектура MoE модели ERNIE-4.5-21B-A3B-Thinking представляет собой прорыв в проектировании эффективных ИИ, наследуя инновации из более широкой серии ERNIE 4.5, включая технику маршрутизации с изоляцией модальностей и технику ортогональной потери маршрутизатора. Активируя всего 3B параметров на каждый токен при сохранении доступа ко всем 21B общим параметрам, модель обеспечивает производительность корпоративного уровня без типичных вычислительных накладных расходов.
Окно контекста модели на 131072 токена и возможность вывода на 65536 токенов позволяют обрабатывать большие документы и генерировать развернутые ответы, что делает её идеальным выбором для сложных аналитических задач, генерации длинного контента и создания подробной технической документации.
Ключевые преимущества по производительности
ERNIE-4.5-21B-A3B-Thinking демонстрирует исключительную производительность в нескольких доменах, достигая результатов уровня state-of-the-art (SOTA, передовых мировых) как часть семейства ERNIE 4.5. Улучшенные возможности рассуждений модели и повышенная глубина анализа делают её особенно эффективной для задач, требующих многоэтапного анализа и решения сложных проблем.

Ключевые преимущества по производительности включают:
- Логические рассуждения: ERNIE-4.5-21B-A3B-Thinking превосходно справляется с задачами на сложный логический вывод, демонстрируя наивысшую производительность в решении головоломок, силлогизмов и многоэтапных задач на рассуждения, требующих тщательного анализа и системного мышления.
- Математика: Модель демонстрирует продвинутые возможности решения математических задач, справляясь с задачами от базовой арифметики до сложного анализа, линейной алгебры и абстрактных математических концепций с высокой точностью.
- Наука: Улучшенные возможности научных рассуждений и анализа позволяют ERNIE-4.5-21B-A3B-Thinking решать задачи по физике, химии, биологии и другим научным доменам, предоставляя подробные объяснения и точные решения.
- Программирование: Благодаря улучшенным возможностям генерации кода и отладки на нескольких языках программирования, модель может писать, анализировать и оптимизировать код, предоставляя понятные объяснения концепций программирования и лучших практик.
- Генерация текста: Высококачественная генерация естественного языка делает ERNIE-4.5-21B-A3B-Thinking идеальным выбором для творческого письма, создания технической документации и задач по созданию контента, требующих тонкого понимания и выразительности.
- Академические бенчмарки: Модель показывает конкурентоспособную производительность на бенчмарках, требующих экспертных знаний человеческого уровня, демонстрируя свою готовность к профессиональным и академическим приложениям.
Проверьте возможности ERNIE-4.5-21B-A3B-Thinking в песочнице Novita AI →
Начало работы с ERNIE-4.5-21B-A3B-Thinking на платформе Novita AI
Novita AI предоставляет несколько способов доступа к ERNIE-4.5-21B-A3B-Thinking, адаптированных под разные уровни технической экспертизы и варианты использования. Независимо от того, являетесь ли вы бизнес-пользователем, изучающим возможности ИИ, или разработчиком, создающим производственные приложения, наша платформа предлагает необходимые вам инструменты и гибкость.
Использование песочницы (Доступно сейчас – не требуется написание кода)
Песочница Novita AI предлагает самый быстрый способ испытать возможности ERNIE-4.5-21B-A3B-Thinking без какой-либо технической настройки:
Мгновенный доступ: Зарегистрируйтесь и начните экспериментировать с ERNIE-4.5-21B-A3B-Thinking за несколько секунд. Для начального тестирования не требуются API-ключи или конфигурация.
Интерактивный интерфейс: Тестируйте промпты и визуализируйте выводы в реальном времени с помощью нашего интуитивного веб-интерфейса. Настраивайте параметры, такие как температура (по умолчанию 0.7), максимальное количество токенов (до 65536) и системные промпты, чтобы увидеть, как они влияют на поведение модели.
Конфигурация модели: Тонко настраивайте формат ответа, температуру, top-p, min-p, top-k, presence penalty, frequency penalty и repetition penalty для оптимизации выводов под ваши конкретные задачи.
Песочница идеально подходит для прототипирования, тестирования идей и понимания возможностей модели перед полной реализацией. Экспортируйте ваши успешные промпты и конфигурации напрямую в код для бесшовного перехода к производственной среде.
Начните тестировать ERNIE-4.5-21B-A3B-Thinking в песочнице →
Интеграция через API (Работает и готово к использованию – для разработчиков)
Для производственных развертываний Novita AI предлагает надежный доступ к API ERNIE-4.5-21B-A3B-Thinking с надежностью и производительностью корпоративного уровня через совместимые с OpenAI конечные точки.
Прямая интеграция через API (Пример на Python)
Подключите ERNIE-4.5-21B-A3B-Thinking к вашим приложениям с помощью нашего API, совместимого с OpenAI:
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key="",
)
model = "baidu/ernie-4.5-21B-a3b-thinking"
stream = True # or False
max_tokens = 32768
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Дополнительная поддержка SDK доступна для TypeScript, Java, Go и Shell для бесшовной интеграции в различные технологические стеки.
Многоагентные рабочие процессы с помощью OpenAI Agents SDK
Создавайте сложные многоагентные системы, использующие улучшенные возможности рассуждений ERNIE-4.5-21B-A3B-Thinking:
- Интеграция без дополнительных настроек: Используйте ERNIE-4.5-21B-A3B-Thinking в любом рабочем процессе OpenAI Agents без модификаций
- Продвинутые возможности агентов: Полная поддержка передачи задач, маршрутизации и интеграции инструментов для сложных рабочих процессов
- Вызов функций: Используйте определения JsonSchema для структурированных взаимодействий и работы с инструментами.
Варианты развертывания
Novita AI предлагает гибкие варианты развертывания, соответствующие вашим конкретным требованиям и паттернам использования.
Безсерверный API
ERNIE-4.5-21B-A3B-Thinking доступен через безсерверный API Novita для мгновенного доступа и оплаты за токены:
- Не требуется настройка: Начните использовать модель мгновенно без управления инфраструктурой
- Оплата по факту использования: $0.07 за 1M входных токенов, $0.28 за 1M выходных токенов
- Совместимые с OpenAI конечные точки: Готовая замена для существующих интеграций с OpenAI
- Автоматическое масштабирование: Обрабатывайте переменные рабочие нагрузки без планирования мощностей
Развертывания по запросу
Для приложений с высокой нагрузкой или чувствительных к задержкам, развертывания по запросу предоставляют выделенные ресурсы:
- Высокопроизводительный стек обслуживания: Оптимизированный движок вывода для максимальной пропускной способности
- Высокая надежность: Выделенные ресурсы GPU обеспечивают стабильную производительность
- Отсутствие лимитов запросов: Масштабируйте в соответствии с вашими потребностями без искусственных ограничений
- Требования к GPU: 80GB видеопамяти (рекомендуется: NVIDIA A100 80GB или H100 80GB для оптимальной производительности).
Интеграция со сторонними платформами
ERNIE-4.5-21B-A3B-Thinking на Novita AI бесшовно интегрируется с вашей существующей экосистемой разработки:
Инструменты разработки: Прямая интеграция с популярными IDE и средами разработки, такими как Cursor, Cline, Continue, Codex и Qwen Code через API, совместимые с OpenAI.
Фреймворки оркестрации: Нативная поддержка LangChain, Dify, CrewAI, Langflow и других платформ для оркестрации ИИ с использованием официальных коннекторов.
Интеграция с Hugging Face: Будучи официальным провайдером вывода для Hugging Face, Novita AI обеспечивает широкую совместимость с экосистемой и простое развертывание моделей.
Заключение
ERNIE-4.5-21B-A3B-Thinking на Novita AI представляет собой прорыв в области эффективных ИИ-рассуждений, предоставляя разработчикам и организациям доступ к самым передовым возможностям рассуждений от Baidu через нашу надежную, масштабируемую платформу.
Уникальное сочетание улучшенной глубины рассуждений, эффективного использования инструментов и понимания контекста на 131K токенов делает эту модель идеальным выбором для сложных задач на рассуждения. При активации всего 3B параметров, обеспечивающих производительность модели на 21B параметров, и требовании всего 80GB видеопамяти GPU, ERNIE-4.5-21B-A3B-Thinking предлагает непревзойденный баланс возможностей и эффективности.
Готовы испытать мощность ERNIE-4.5-21B-A3B-Thinking? Наша песочница предоставляет мгновенный доступ без необходимости настройки – идеально подходит для изучения возможностей модели и тестирования ваших вариантов использования. Начните с нашего интерактивного интерфейса, чтобы понять сильные стороны модели, а затем бесшовно перейдите к интеграции через API, когда будете готовы к производственному развертыванию.
Получите доступ к ERNIE-4.5-21B-A3B-Thinking в песочнице Novita AI сейчас →
Трансформируйте ваши проекты с помощью продвинутых ИИ-рассуждений всего за $0.07 за миллион входных токенов. Начните исследование за несколько секунд!
Novita AI — это облачная ИИ-платформа, которая предлагает разработчикам простой способ развертывать ИИ-модели с помощью нашего простого API, а также предоставляет доступное и надежное облако GPU для построения и масштабирования решений.
