DeepSeek выпустила две революционные модели — DeepSeek-R1-0528 и DeepSeek-R1-0528-Qwen3-8B — обе теперь доступны на Novita AI, облачной AI-платформе, которая предоставляет разработчикам лёгкое развёртывание AI-моделей через наш простой API. Эти модели обеспечивают исключительные способности к рассуждению по конкурентоспособным ценам, демонстрируя значительно лучшую производительность, чем их предшественники.
Novita AI предлагает обе модели DeepSeek-R1-0528 по конкурентоспособным тарифам с прозрачной оплатой по мере использования:
DeepSeek-R1-0528 (Полная модель):
- Входные токены: $0,7 за миллион токенов
- Выходные токены: $2,5 за миллион токенов
DeepSeek-R1-0528-Qwen3-8B (Эффективная модель на 8B):
- Входные токены: $0,06 за миллион токенов
- Выходные токены: $0,09 за миллион токенов
Попробовать демо DeepSeek-R1-0528
Что такое DeepSeek-R1-0528?
Модель DeepSeek R1 получила минорное обновление версии — текущая версия называется DeepSeek-R1-0528. В этом последнем обновлении DeepSeek R1 значительно улучшила глубину рассуждений и способности к выводу за счёт увеличения вычислительных ресурсов и внедрения механизмов алгоритмической оптимизации во время пост-тренировки.
Модель демонстрирует выдающиеся результаты в различных бенчмарках, включая математику, программирование и общую логику. Её общая производительность теперь приближается к ведущим моделям, таким как O3 и Gemini 2.5 Pro.
Ключевые улучшения DeepSeek-R1-0528
🔹 Улучшенные результаты бенчмарков в математике, кодировании и задачах на рассуждение
🔹 Улучшенные возможности пользовательского интерфейса для лучшего опыта
🔹 Снижение галлюцинаций для более надёжных результатов
🔹 Поддержка вывода JSON и вызова функций для бесшовной интеграции
Увеличенная глубина рассуждений
По сравнению с предыдущей версией, обновлённая модель показывает значительные улучшения в обработке сложных задач на рассуждение. Например, в тесте AIME 2025 точность модели выросла с 70% в предыдущей версии до 87,5% в текущей.
Этот прогресс обусловлен увеличенной глубиной мышления в процессе рассуждения: в тестовом наборе AIME предыдущая модель использовала в среднем 12K токенов на вопрос, тогда как новая версия — в среднем 23K токенов на вопрос.
Конкурентоспособная производительность среди лидеров индустрии
DeepSeek-R1-0528 демонстрирует замечательную производительность в сравнении с ведущими моделями индустрии по нескольким сложным бенчмаркам:

DeepSeek-R1 против DeepSeek-R1-0528
Производительность в математических рассуждениях
| Бенчмарк | DeepSeek R1 | DeepSeek R1-0528 | Улучшение |
|---|---|---|---|
| AIME 2024 (Pass@1) | 79,8 | 91,4 | +11,6 |
| AIME 2025 (Pass@1) | 70,0 | 87,5 | +17,5 |
| HMMT 2025 (Pass@1) | 41,7 | 79,4 | +37,7 |
| CNMO 2024 (Pass@1) | 78,8 | 86,9 | +8,1 |
Улучшение производительности в кодировании
| Бенчмарк | DeepSeek R1 | DeepSeek R1-0528 | Улучшение |
|---|---|---|---|
| LiveCodeBench (Pass@1) | 63,5 | 73,3 | +9,8 |
| Codeforces-Div1 (Rating) | 1530 | 1930 | +400 |
| SWE Verified (Resolved) | 49,2 | 57,6 | +8,4 |
| Aider-Polyglot (Acc.) | 53,3 | 71,6 | +18,3 |
Общие задачи на рассуждение
| Бенчмарк | DeepSeek R1 | DeepSeek R1-0528 | Улучшение |
|---|---|---|---|
| MMLU-Redux (EM) | 92,9 | 93,4 | +0,5 |
| MMLU-Pro (EM) | 84,0 | 85,0 | +1,0 |
| GPQA-Diamond (Pass@1) | 71,5 | 81,0 | +9,5 |
| SimpleQA (Correct) | 30,1 | 27,8 | -2,3 |
| FRAMES (Acc.) | 82,5 | 83,0 | +0,5 |
| Humanity’s Last Exam (Pass@1) | 8,5 | 17,7 | +9,2 |
Новые возможности интеграции инструментов
DeepSeek-R1-0528 представляет улучшенные возможности вызова функций и интеграции инструментов:
- BFCL_v3_MultiTurn (Acc): 37,0%
- Tau-Bench (Pass@1): 53,5% (Airline) / 63,9% (Retail)
DeepSeek-R1-0528-Qwen3-8B: Компактное совершенство
DeepSeek дистиллировала цепочку рассуждений DeepSeek-R1-0528 для создания DeepSeek-R1-0528-Qwen3-8B на базе Qwen3 8B Base. Эта модель достигает передовой (SOTA) производительности среди моделей с открытым исходным кодом на AIME 2024, превосходя Qwen3-8B на +10,0% и соответствуя производительности Qwen3-235B-thinking.
Это демонстрирует, что цепочка рассуждений DeepSeek-R1-0528 имеет большое значение как для академических исследований моделей рассуждений, так и для индустриальной разработки малых моделей.
Сравнительный анализ с ведущими моделями
| Модель | AIME 24 | AIME 25 | HMMT Feb 25 | GPQA Diamond | LiveCodeBench |
|---|---|---|---|---|---|
| Qwen3-235B-A22B | 85,7 | 81,5 | 62,5 | 71,1 | 66,5 |
| Qwen3-32B | 81,4 | 72,9 | - | 68,4 | - |
| Qwen3-8B | 76,0 | 67,3 | - | 62,0 | - |
| Phi-4-Reasoning-Plus-14B | 81,3 | 78,0 | 53,6 | 69,3 | - |
| Gemini-2.5-Flash-Thinking-0520 | 82,3 | 72,0 | 64,2 | 82,8 | 62,3 |
| o3-mini (medium) | 79,6 | 76,7 | 53,3 | 76,8 | 65,9 |
| DeepSeek-R1-0528-Qwen3-8B | 86,0 | 76,3 | 61,5 | 61,1 | 60,5 |
Улучшения использования и технические детали
Улучшенные функции удобства
По сравнению с предыдущими версиями DeepSeek-R1, рекомендации по использованию DeepSeek-R1-0528 включают следующие улучшения:
- Поддержка системного промпта: в отличие от более ранних версий, теперь можно использовать системные промпты для предоставления единого контекста и инструкций
- Автоматический режим размышления: не требуется ручная активация — модель автоматически включает свои способности к рассуждению, без необходимости добавления "размышление\ " в начале вывода
Архитектура DeepSeek-R1-0528-Qwen3-8B
Архитектура модели DeepSeek-R1-0528-Qwen3-8B идентична Qwen3-8B, но использует ту же конфигурацию токенизатора, что и DeepSeek-R1-0528. Эта модель может запускаться так же, как Qwen3-8B, но убедитесь, что все конфигурационные файлы взяты из репозитория DeepSeek, а не из оригинального проекта Qwen3.
Почему разработчики выбирают Novita AI
Упрощённое развёртывание AI-моделей
- Без хлопот с инфраструктурой: сосредоточьтесь на создании приложений, а не на управлении серверами
- Мгновенный доступ к моделям: развёртывайте современные модели одним вызовом API
- Надёжная производительность: инфраструктура корпоративного уровня с аптаймом 99,9%
- Глобальная доступность: низкая задержка из любой точки мира
Подходит для любого масштаба
- Быстрое прототипирование: тестируйте идеи быстро благодаря мгновенному доступу к моделям
- Готовность к продакшену: бесшовное масштабирование от прототипа до продакшена
- Экономическая эффективность: платите только за то, что используете, с прозрачным ценообразованием
- Корпоративная поддержка: выделенная поддержка для приложений с высокими объёмами
Идеальные варианты использования
- Математические AI-приложения: создавайте образовательные платформы с точностью 87,5% на AIME 2025
- Инструменты генерации кода: создавайте помощников разработчика с успехом 73,3% на LiveCodeBench
- Исследовательские платформы: развёртывайте модели рассуждений, конкурирующие с лидерами индустрии
- Образовательное ПО: разрабатывайте приложения для пошагового решения задач
Начало работы на Novita AI
- Зарегистрируйтесь за секунды на Novita AI и получите $10 бесплатных кредитов
- Изучите DeepSeek-R1-0528 (полные возможности) или DeepSeek-R1-0528-Qwen3-8B (эффективная модель)
- Получите свой API-ключ из панели управления
- Сделайте первый вызов API, используя наши конечные точки, совместимые с OpenAI
- Начните создавать с помощью ведущих в индустрии способностей к рассуждению
Для пользователей Python:
from openai import OpenAI
base_url = "https://api.novita.ai/v3/openai"
api_key = "<Your API Key>"
model = "deepseek/deepseek-r1-0528"
client = OpenAI(
base_url=base_url,
api_key=api_key,
)
stream = True # or False
max_tokens = 1000
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
extra_body={
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Заключение
Модели серии DeepSeek-R1-0528 обеспечивают ведущую производительность по конкурентоспособным ценам — достигая 91,4% на AIME 2024 и 73,3% на LiveCodeBench, соперничая с возможностями OpenAI-o3 и Gemini-2.5-Pro.
Через удобную для разработчиков платформу Novita AI вы получаете мгновенный доступ к этим передовым моделям без сложностей с инфраструктурой. Благодаря прозрачному ценообразованию, $10 бесплатным кредитам и нашему интуитивному API, интеграция мировых рассуждений в ваши приложения стала проще, чем когда-либо.
Novita AI — это облачная AI-платформа, которая предлагает разработчикам простой способ развёртывания AI-моделей через наш простой API, а также предоставляет доступное и надёжное GPU-облако для создания приложений.
