DeepSeek-R1-0528 и DeepSeek-R1-0528-Qwen3-8B теперь доступны на Novita AI

Содержание

Что такое DeepSeek-R1-0528?
DeepSeek-R1 против DeepSeek-R1-0528
DeepSeek-R1-0528-Qwen3-8B: Компактное совершенство
Улучшения использования и технические детали
Почему разработчики выбирают Novita AI
Начало работы на Novita AI
Заключение

DeepSeek выпустила две революционные модели — DeepSeek-R1-0528 и DeepSeek-R1-0528-Qwen3-8B — обе теперь доступны на Novita AI, облачной AI-платформе, которая предоставляет разработчикам лёгкое развёртывание AI-моделей через наш простой API. Эти модели обеспечивают исключительные способности к рассуждению по конкурентоспособным ценам, демонстрируя значительно лучшую производительность, чем их предшественники.

Novita AI предлагает обе модели DeepSeek-R1-0528 по конкурентоспособным тарифам с прозрачной оплатой по мере использования:

DeepSeek-R1-0528 (Полная модель):

Входные токены: $0,7 за миллион токенов
Выходные токены: $2,5 за миллион токенов

DeepSeek-R1-0528-Qwen3-8B (Эффективная модель на 8B):

Входные токены: $0,06 за миллион токенов
Выходные токены: $0,09 за миллион токенов

Попробовать демо DeepSeek-R1-0528

Что такое DeepSeek-R1-0528?

Модель DeepSeek R1 получила минорное обновление версии — текущая версия называется DeepSeek-R1-0528. В этом последнем обновлении DeepSeek R1 значительно улучшила глубину рассуждений и способности к выводу за счёт увеличения вычислительных ресурсов и внедрения механизмов алгоритмической оптимизации во время пост-тренировки.

Модель демонстрирует выдающиеся результаты в различных бенчмарках, включая математику, программирование и общую логику. Её общая производительность теперь приближается к ведущим моделям, таким как O3 и Gemini 2.5 Pro.

Ключевые улучшения DeepSeek-R1-0528

🔹 Улучшенные результаты бенчмарков в математике, кодировании и задачах на рассуждение
🔹 Улучшенные возможности пользовательского интерфейса для лучшего опыта
🔹 Снижение галлюцинаций для более надёжных результатов
🔹 Поддержка вывода JSON и вызова функций для бесшовной интеграции

Увеличенная глубина рассуждений

По сравнению с предыдущей версией, обновлённая модель показывает значительные улучшения в обработке сложных задач на рассуждение. Например, в тесте AIME 2025 точность модели выросла с 70% в предыдущей версии до 87,5% в текущей.

Этот прогресс обусловлен увеличенной глубиной мышления в процессе рассуждения: в тестовом наборе AIME предыдущая модель использовала в среднем 12K токенов на вопрос, тогда как новая версия — в среднем 23K токенов на вопрос.

Конкурентоспособная производительность среди лидеров индустрии

DeepSeek-R1-0528 демонстрирует замечательную производительность в сравнении с ведущими моделями индустрии по нескольким сложным бенчмаркам:

DeepSeek-R1 против DeepSeek-R1-0528

Производительность в математических рассуждениях

Бенчмарк	DeepSeek R1	DeepSeek R1-0528	Улучшение
AIME 2024 (Pass@1)	79,8	91,4	+11,6
AIME 2025 (Pass@1)	70,0	87,5	+17,5
HMMT 2025 (Pass@1)	41,7	79,4	+37,7
CNMO 2024 (Pass@1)	78,8	86,9	+8,1

Улучшение производительности в кодировании

Бенчмарк	DeepSeek R1	DeepSeek R1-0528	Улучшение
LiveCodeBench (Pass@1)	63,5	73,3	+9,8
Codeforces-Div1 (Rating)	1530	1930	+400
SWE Verified (Resolved)	49,2	57,6	+8,4
Aider-Polyglot (Acc.)	53,3	71,6	+18,3

Общие задачи на рассуждение

Бенчмарк	DeepSeek R1	DeepSeek R1-0528	Улучшение
MMLU-Redux (EM)	92,9	93,4	+0,5
MMLU-Pro (EM)	84,0	85,0	+1,0
GPQA-Diamond (Pass@1)	71,5	81,0	+9,5
SimpleQA (Correct)	30,1	27,8	-2,3
FRAMES (Acc.)	82,5	83,0	+0,5
Humanity’s Last Exam (Pass@1)	8,5	17,7	+9,2

Новые возможности интеграции инструментов

DeepSeek-R1-0528 представляет улучшенные возможности вызова функций и интеграции инструментов:

BFCL_v3_MultiTurn (Acc): 37,0%
Tau-Bench (Pass@1): 53,5% (Airline) / 63,9% (Retail)

DeepSeek-R1-0528-Qwen3-8B: Компактное совершенство

DeepSeek дистиллировала цепочку рассуждений DeepSeek-R1-0528 для создания DeepSeek-R1-0528-Qwen3-8B на базе Qwen3 8B Base. Эта модель достигает передовой (SOTA) производительности среди моделей с открытым исходным кодом на AIME 2024, превосходя Qwen3-8B на +10,0% и соответствуя производительности Qwen3-235B-thinking.

Это демонстрирует, что цепочка рассуждений DeepSeek-R1-0528 имеет большое значение как для академических исследований моделей рассуждений, так и для индустриальной разработки малых моделей.

Сравнительный анализ с ведущими моделями

Модель	AIME 24	AIME 25	HMMT Feb 25	GPQA Diamond	LiveCodeBench
Qwen3-235B-A22B	85,7	81,5	62,5	71,1	66,5
Qwen3-32B	81,4	72,9	-	68,4	-
Qwen3-8B	76,0	67,3	-	62,0	-
Phi-4-Reasoning-Plus-14B	81,3	78,0	53,6	69,3	-
Gemini-2.5-Flash-Thinking-0520	82,3	72,0	64,2	82,8	62,3
o3-mini (medium)	79,6	76,7	53,3	76,8	65,9
DeepSeek-R1-0528-Qwen3-8B	86,0	76,3	61,5	61,1	60,5

Улучшения использования и технические детали

Улучшенные функции удобства

По сравнению с предыдущими версиями DeepSeek-R1, рекомендации по использованию DeepSeek-R1-0528 включают следующие улучшения:

Поддержка системного промпта: в отличие от более ранних версий, теперь можно использовать системные промпты для предоставления единого контекста и инструкций
Автоматический режим размышления: не требуется ручная активация — модель автоматически включает свои способности к рассуждению, без необходимости добавления "размышление\ " в начале вывода

Архитектура DeepSeek-R1-0528-Qwen3-8B

Архитектура модели DeepSeek-R1-0528-Qwen3-8B идентична Qwen3-8B, но использует ту же конфигурацию токенизатора, что и DeepSeek-R1-0528. Эта модель может запускаться так же, как Qwen3-8B, но убедитесь, что все конфигурационные файлы взяты из репозитория DeepSeek, а не из оригинального проекта Qwen3.

Почему разработчики выбирают Novita AI

Упрощённое развёртывание AI-моделей

Без хлопот с инфраструктурой: сосредоточьтесь на создании приложений, а не на управлении серверами
Мгновенный доступ к моделям: развёртывайте современные модели одним вызовом API
Надёжная производительность: инфраструктура корпоративного уровня с аптаймом 99,9%
Глобальная доступность: низкая задержка из любой точки мира

Подходит для любого масштаба

Быстрое прототипирование: тестируйте идеи быстро благодаря мгновенному доступу к моделям
Готовность к продакшену: бесшовное масштабирование от прототипа до продакшена
Экономическая эффективность: платите только за то, что используете, с прозрачным ценообразованием
Корпоративная поддержка: выделенная поддержка для приложений с высокими объёмами

Идеальные варианты использования

Математические AI-приложения: создавайте образовательные платформы с точностью 87,5% на AIME 2025
Инструменты генерации кода: создавайте помощников разработчика с успехом 73,3% на LiveCodeBench
Исследовательские платформы: развёртывайте модели рассуждений, конкурирующие с лидерами индустрии
Образовательное ПО: разрабатывайте приложения для пошагового решения задач

Начало работы на Novita AI

Зарегистрируйтесь за секунды на Novita AI и получите $10 бесплатных кредитов
Изучите DeepSeek-R1-0528 (полные возможности) или DeepSeek-R1-0528-Qwen3-8B (эффективная модель)
Получите свой API-ключ из панели управления
Сделайте первый вызов API, используя наши конечные точки, совместимые с OpenAI
Начните создавать с помощью ведущих в индустрии способностей к рассуждению

Для пользователей Python:

from openai import OpenAI

base_url = "https://api.novita.ai/v3/openai"
api_key = "<Your API Key>"
model = "deepseek/deepseek-r1-0528"

client = OpenAI(
    base_url=base_url,
    api_key=api_key,
)

stream = True # or False
max_tokens = 1000

response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    extra_body={
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Заключение

Модели серии DeepSeek-R1-0528 обеспечивают ведущую производительность по конкурентоспособным ценам — достигая 91,4% на AIME 2024 и 73,3% на LiveCodeBench, соперничая с возможностями OpenAI-o3 и Gemini-2.5-Pro.

Через удобную для разработчиков платформу Novita AI вы получаете мгновенный доступ к этим передовым моделям без сложностей с инфраструктурой. Благодаря прозрачному ценообразованию, $10 бесплатным кредитам и нашему интуитивному API, интеграция мировых рассуждений в ваши приложения стала проще, чем когда-либо.

Novita AI — это облачная AI-платформа, которая предлагает разработчикам простой способ развёртывания AI-моделей через наш простой API, а также предоставляет доступное и надёжное GPU-облако для создания приложений.

DeepSeek-R1-0528 и DeepSeek-R1-0528-Qwen3-8B теперь доступны на Novita AI