DeepSeek-R1-0528 и DeepSeek-R1-0528-Qwen3-8B теперь доступны на Novita AI

DeepSeek-R1-0528 и DeepSeek-R1-0528-Qwen3-8B теперь доступны на Novita AI

DeepSeek выпустила две революционные модели — DeepSeek-R1-0528 и DeepSeek-R1-0528-Qwen3-8B — обе теперь доступны на Novita AI, облачной AI-платформе, которая предоставляет разработчикам лёгкое развёртывание AI-моделей через наш простой API. Эти модели обеспечивают исключительные способности к рассуждению по конкурентоспособным ценам, демонстрируя значительно лучшую производительность, чем их предшественники.

Novita AI предлагает обе модели DeepSeek-R1-0528 по конкурентоспособным тарифам с прозрачной оплатой по мере использования:

DeepSeek-R1-0528 (Полная модель):

  • Входные токены: $0,7 за миллион токенов
  • Выходные токены: $2,5 за миллион токенов

DeepSeek-R1-0528-Qwen3-8B (Эффективная модель на 8B):

  • Входные токены: $0,06 за миллион токенов
  • Выходные токены: $0,09 за миллион токенов

Попробовать демо DeepSeek-R1-0528

Что такое DeepSeek-R1-0528?

Модель DeepSeek R1 получила минорное обновление версии — текущая версия называется DeepSeek-R1-0528. В этом последнем обновлении DeepSeek R1 значительно улучшила глубину рассуждений и способности к выводу за счёт увеличения вычислительных ресурсов и внедрения механизмов алгоритмической оптимизации во время пост-тренировки.

Модель демонстрирует выдающиеся результаты в различных бенчмарках, включая математику, программирование и общую логику. Её общая производительность теперь приближается к ведущим моделям, таким как O3 и Gemini 2.5 Pro.

Ключевые улучшения DeepSeek-R1-0528

🔹 Улучшенные результаты бенчмарков в математике, кодировании и задачах на рассуждение
🔹 Улучшенные возможности пользовательского интерфейса для лучшего опыта
🔹 Снижение галлюцинаций для более надёжных результатов
🔹 Поддержка вывода JSON и вызова функций для бесшовной интеграции

Увеличенная глубина рассуждений

По сравнению с предыдущей версией, обновлённая модель показывает значительные улучшения в обработке сложных задач на рассуждение. Например, в тесте AIME 2025 точность модели выросла с 70% в предыдущей версии до 87,5% в текущей.

Этот прогресс обусловлен увеличенной глубиной мышления в процессе рассуждения: в тестовом наборе AIME предыдущая модель использовала в среднем 12K токенов на вопрос, тогда как новая версия — в среднем 23K токенов на вопрос.

Конкурентоспособная производительность среди лидеров индустрии

DeepSeek-R1-0528 демонстрирует замечательную производительность в сравнении с ведущими моделями индустрии по нескольким сложным бенчмаркам:

бенчмарк deepseek r1 0528

DeepSeek-R1 против DeepSeek-R1-0528

Производительность в математических рассуждениях

Бенчмарк DeepSeek R1 DeepSeek R1-0528 Улучшение
AIME 2024 (Pass@1) 79,8 91,4 +11,6
AIME 2025 (Pass@1) 70,0 87,5 +17,5
HMMT 2025 (Pass@1) 41,7 79,4 +37,7
CNMO 2024 (Pass@1) 78,8 86,9 +8,1

Улучшение производительности в кодировании

Бенчмарк DeepSeek R1 DeepSeek R1-0528 Улучшение
LiveCodeBench (Pass@1) 63,5 73,3 +9,8
Codeforces-Div1 (Rating) 1530 1930 +400
SWE Verified (Resolved) 49,2 57,6 +8,4
Aider-Polyglot (Acc.) 53,3 71,6 +18,3

Общие задачи на рассуждение

Бенчмарк DeepSeek R1 DeepSeek R1-0528 Улучшение
MMLU-Redux (EM) 92,9 93,4 +0,5
MMLU-Pro (EM) 84,0 85,0 +1,0
GPQA-Diamond (Pass@1) 71,5 81,0 +9,5
SimpleQA (Correct) 30,1 27,8 -2,3
FRAMES (Acc.) 82,5 83,0 +0,5
Humanity’s Last Exam (Pass@1) 8,5 17,7 +9,2

Новые возможности интеграции инструментов

DeepSeek-R1-0528 представляет улучшенные возможности вызова функций и интеграции инструментов:

  • BFCL_v3_MultiTurn (Acc): 37,0%
  • Tau-Bench (Pass@1): 53,5% (Airline) / 63,9% (Retail)

DeepSeek-R1-0528-Qwen3-8B: Компактное совершенство

DeepSeek дистиллировала цепочку рассуждений DeepSeek-R1-0528 для создания DeepSeek-R1-0528-Qwen3-8B на базе Qwen3 8B Base. Эта модель достигает передовой (SOTA) производительности среди моделей с открытым исходным кодом на AIME 2024, превосходя Qwen3-8B на +10,0% и соответствуя производительности Qwen3-235B-thinking.

Это демонстрирует, что цепочка рассуждений DeepSeek-R1-0528 имеет большое значение как для академических исследований моделей рассуждений, так и для индустриальной разработки малых моделей.

Сравнительный анализ с ведущими моделями

Модель AIME 24 AIME 25 HMMT Feb 25 GPQA Diamond LiveCodeBench
Qwen3-235B-A22B 85,7 81,5 62,5 71,1 66,5
Qwen3-32B 81,4 72,9 - 68,4 -
Qwen3-8B 76,0 67,3 - 62,0 -
Phi-4-Reasoning-Plus-14B 81,3 78,0 53,6 69,3 -
Gemini-2.5-Flash-Thinking-0520 82,3 72,0 64,2 82,8 62,3
o3-mini (medium) 79,6 76,7 53,3 76,8 65,9
DeepSeek-R1-0528-Qwen3-8B 86,0 76,3 61,5 61,1 60,5

Улучшения использования и технические детали

Улучшенные функции удобства

По сравнению с предыдущими версиями DeepSeek-R1, рекомендации по использованию DeepSeek-R1-0528 включают следующие улучшения:

  • Поддержка системного промпта: в отличие от более ранних версий, теперь можно использовать системные промпты для предоставления единого контекста и инструкций
  • Автоматический режим размышления: не требуется ручная активация — модель автоматически включает свои способности к рассуждению, без необходимости добавления "размышление\ " в начале вывода

Архитектура DeepSeek-R1-0528-Qwen3-8B

Архитектура модели DeepSeek-R1-0528-Qwen3-8B идентична Qwen3-8B, но использует ту же конфигурацию токенизатора, что и DeepSeek-R1-0528. Эта модель может запускаться так же, как Qwen3-8B, но убедитесь, что все конфигурационные файлы взяты из репозитория DeepSeek, а не из оригинального проекта Qwen3.

Почему разработчики выбирают Novita AI

Упрощённое развёртывание AI-моделей

  • Без хлопот с инфраструктурой: сосредоточьтесь на создании приложений, а не на управлении серверами
  • Мгновенный доступ к моделям: развёртывайте современные модели одним вызовом API
  • Надёжная производительность: инфраструктура корпоративного уровня с аптаймом 99,9%
  • Глобальная доступность: низкая задержка из любой точки мира

Подходит для любого масштаба

  • Быстрое прототипирование: тестируйте идеи быстро благодаря мгновенному доступу к моделям
  • Готовность к продакшену: бесшовное масштабирование от прототипа до продакшена
  • Экономическая эффективность: платите только за то, что используете, с прозрачным ценообразованием
  • Корпоративная поддержка: выделенная поддержка для приложений с высокими объёмами

Идеальные варианты использования

  • Математические AI-приложения: создавайте образовательные платформы с точностью 87,5% на AIME 2025
  • Инструменты генерации кода: создавайте помощников разработчика с успехом 73,3% на LiveCodeBench
  • Исследовательские платформы: развёртывайте модели рассуждений, конкурирующие с лидерами индустрии
  • Образовательное ПО: разрабатывайте приложения для пошагового решения задач

Начало работы на Novita AI

  1. Зарегистрируйтесь за секунды на Novita AI и получите $10 бесплатных кредитов
  2. Изучите DeepSeek-R1-0528 (полные возможности) или DeepSeek-R1-0528-Qwen3-8B (эффективная модель)
  3. Получите свой API-ключ из панели управления
  4. Сделайте первый вызов API, используя наши конечные точки, совместимые с OpenAI
  5. Начните создавать с помощью ведущих в индустрии способностей к рассуждению

Для пользователей Python:

from openai import OpenAI

base_url = "https://api.novita.ai/v3/openai"
api_key = "<Your API Key>"
model = "deepseek/deepseek-r1-0528"

client = OpenAI(
    base_url=base_url,
    api_key=api_key,
)

stream = True # or False
max_tokens = 1000

response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    extra_body={
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

Заключение

Модели серии DeepSeek-R1-0528 обеспечивают ведущую производительность по конкурентоспособным ценам — достигая 91,4% на AIME 2024 и 73,3% на LiveCodeBench, соперничая с возможностями OpenAI-o3 и Gemini-2.5-Pro.

Через удобную для разработчиков платформу Novita AI вы получаете мгновенный доступ к этим передовым моделям без сложностей с инфраструктурой. Благодаря прозрачному ценообразованию, $10 бесплатным кредитам и нашему интуитивному API, интеграция мировых рассуждений в ваши приложения стала проще, чем когда-либо.

Novita AI — это облачная AI-платформа, которая предлагает разработчикам простой способ развёртывания AI-моделей через наш простой API, а также предоставляет доступное и надёжное GPU-облако для создания приложений.