DeepSeek-V4-Pro на Novita AI: 1 млн контекстов, лучший результат в LiveCodeBench

DeepSeek-V4-Pro: 1 млн контекстов, №1 в LiveCodeBench, Open-Source Frontier

Вы оцениваете модели с открытым исходным кодом для агента по разработке кода в производственной среде. Вам нужно что-то, что обрабатывает большие кодовые базы — целые репозитории, а не только отдельные файлы — и действительно решает проблемы GitHub без фиктивных вызовов инструментов. Каждая модель, которую вы пробуете, либо разваливается после обработки более 128 000 токенов, либо отстает от GPT-4o в тестах, важных для реальных инженерных задач.

DeepSeek-V4-Pro меняет этот подход. Это модель MoE с 1.6 триллионами параметров, имеющая контекстное окно в 1 миллион токенов, наивысший опубликованный результат на LiveCodeBench (93.5 Pass@1) и рейтинг Codeforces 3206 — оба показателя занимают первое место среди всех оцениваемых моделей, включая закрытые API. Вкратце: это лучшая на сегодняшний день модель с открытым исходным кодом для соревновательного программирования и задач с большим контекстом, выпущенная под лицензией MIT. На сегодняшний день она доступна по адресу: Novita AI.

Оглавление

Что такое DeepSeek-V4-Pro?

DeepSeek-V4-Pro — флагманская модель серии V4 от DeepSeek, выпущенная 24 апреля 2026 года. Она занимает более высокое положение, чем облегченная версия. DeepSeek-V4-Flash (Всего 284 млрд / 13 млрд активных) и позиционируется как предварительный показ текущих возможностей DeepSeek — того, что они описывают как «лучшую на сегодняшний день модель с открытым исходным кодом» для работы со знаниями и программированием. Модель обучена на более чем 32 триллионах токенов и доработана с помощью двухэтапного конвейера: SFT-обучение с подкреплением от эксперта в предметной области + GRPO-обучение с подкреплением, за которым следует дистилляция на основе политики. Полные технические подробности приведены в статье DeepSeek. DeepSeek-V4: На пути к высокоэффективному контекстному анализу на основе миллионов токенов..

Краткий обзор основных характеристик:

  • Архитектура: Модель «смесь экспертов» (MoE) с гибридным вниманием — сжатое разреженное внимание (CSA) + сильно сжатое внимание (HCA)
  • Параметры: Всего 1.6 Тл / 49 Б активировано за один проход вперед
  • Контекстное окно: 1 048 576 токенов (1 млн)
  • Точность: FP4 (эксперты Министерства образования) + смешанная FP8
  • Режимы рассуждения: Не думать (быстро), Думать (стандартный CoT), Макс (максимальный бюджет рассуждений)
  • Возможности: Вызов функций, структурированные выходные данные, рассуждения, извлечение контекста из 1 миллиона записей.
  • Лицензия: MIT

Главные преимущества

Гибридное внимание для эффективного контекстного анализа 1 миллиона токенов

Большинство моделей, заявляющих о «длинном контексте», либо незаметно обрезают данные, либо резко ухудшают производительность при объеме данных более 128 000 токенов. Гибридная архитектура внимания DeepSeek-V4-Pro, сочетающая в себе сжатое разреженное внимание (CSA) и сильно сжатое внимание (HCA) с гиперсвязями с ограничениями на многообразие (mHC), разработана с нуля для эффективной обработки миллионов токенов. На практике: MRCR 1M показывает результат 83.5 (восстановление памяти в контексте 1 миллиона токенов), а CorpusQA 1M — 62.0, при этом сохраняя связность рассуждений на протяжении всего временного окна. Для агентов, которым необходимо обработать весь код, журналы за день или документ размером с книгу за один вызов, эта архитектура делает их жизнеспособными без специализированной инфраструктуры.

№1 на LiveCodeBench и Codeforces — модель программирования, которая действительно конкурентоспособна.

Результаты DeepSeek-V4-Pro 93.5 на LiveCodeBench (Проход@1) и 3206 баллов в рейтинге Codeforces— Оба показателя являются самыми высокими в сравнительной таблице, превосходя Claude Opus 4.6 Max (88.8 / без оценки), Gemini 3.1 Pro High (91.7 / 3052) и GPT-5.4 xHigh (без оценки LCB / 3168). По показателю SWE-Verified (решение реальных проблем на GitHub) он достигает 80.6, что сопоставимо с Claude Opus 4.6 Max (80.8) и Gemini 3.1 Pro (80.6). Для команд, разрабатывающих агентов программирования, где «возможность реального исправления ошибки» важнее теоретических показателей MMLU, V4-Pro является вариантом с открытым исходным кодом, напрямую конкурирующим с закрытыми API.

Три режима рассуждения — сопоставление вычислительных задач с поставленной задачей

DeepSeek-V4-Pro предоставляет три режима вывода данных через одну и ту же точку доступа API:

  • Не думать: Отсутствие логической цепочки рассуждений. Быстродействие, низкая задержка — подходит для задач классификации, извлечения данных и структурированного вывода, где затраты на рассуждения излишни.
  • Считать: Стандартный подход к рассуждениям CoT. Используется по умолчанию для программирования, математики и многоэтапных задач.
  • Макс (V4-Pro Макс): Расширенный бюджет рассуждений. Используется, когда точность важнее скорости — сложные доказательства, трудные задачи по соревновательному программированию, углублённые сеансы отладки.

Все три режима доступны через deepseek/deepseek-v4-pro идентификатор модели, поддерживаемый Novita AIПереключение между ними осуществляется с помощью инструкции уровня приглашения, а не другой конечной точки, что означает, что вы можете реализовать адаптивный выбор режима в своем приложении без изменения конфигурации API.

Эффективность использования агентов и инструментов

Помимо результатов тестов на программирование, V4-Pro демонстрирует неплохие результаты и в тестах на агентские модели. BrowseComp: 83.4 (против Claude Opus 83.7, Gemini 85.9 — разница всего 2.5 балла). MCPAtlas Public: 73.6, второе место после Claude Opus 4.6 (73.8). Toolathlon: 51.8, третье место в общем зачете. Это не результаты, превосходящие все модели, но они подтверждают, что V4-Pro — это универсальная агентская модель, а не просто оптимизированный для бенчмарков специалист по программированию. В сочетании с поддержкой вызова функций это практичный выбор для агентов, которым необходимо просматривать информацию, вызывать инструменты и рассуждать в рамках одной сессии.

Тестовая производительность

В таблице ниже приведены результаты официальных сравнительных тестов DeepSeek. «V4-Pro» обозначает режим DeepSeek-V4-Pro Max (расширенный режим анализа данных) — ту же модель, доступную через... deepseek/deepseek-v4-pro API ID на Novita.

Сравнительная таблица производительности DeepSeek-V4-Pro, показывающая результаты LiveCodeBench, Codeforces, SWE-Verified, BrowseComp по сравнению с Claude Opus, Gemini 3.1 Pro и GPT-5.4.
Производительность DeepSeek-V4-Pro в тестах на программирование, логическое мышление и работу агентов. [Источник: DeepSeek HuggingFace]
эталонный тестDeepSeek-V4-ProКлод Опус 4.6Близнецы 3.1 ПроGPT-5.4
LiveCodeBench (Pass@1)93.5 ✓88.891.7-
Рейтинг Codeforces3206 ✓-30523168
SWE-проверено80.680.880.6-
SWE Pro55.457.354.257.7
BrowseComp83.483.785.982.7
MCPAtlas Public73.673.869.267.2
GPQA-Бриллиант90.191.394.393.0
HLE (Pass@1)37.740.044.439.8
IMOAnswerBench89.875.381.091.4
HMMT 2026 февраль95.296.294.797.7
MRCR 1M (MMR)83.592.976.3-
CorpusQA 1M62.071.753.8-
Терминал Bench 2.067.965.468.575.1

✓ = наивысший опубликованный балл в этом сравнении. Последняя проверка: 25.04.2026. Баллы отражают «максимальный» / расширенный режим рассуждений, где это применимо. Источник: Модель карты DeepSeek HuggingFace.

Честное чтение: В тестах на проверку знаний (GPQA Diamond, HLE) Gemini 3.1 Pro и GPT-5.4 явно превосходят V4-Pro. Преимущество V4-Pro заключается в навыках программирования — LiveCodeBench и Codeforces однозначно занимают первые места — и в извлечении информации из длинного контекста по сравнению с другими моделями с открытым исходным кодом. В математических вычислениях разрыв неоднозначен: V1-Pro превосходит GPT-5.4 в IMOAnswerBench (89.8 против 91.4, близко), но отстает в HMMT 2026 (95.2 против 97.7).

Как использовать DeepSeek-V4-Pro при поддержке Novita AI

Вариант 1: Игровая площадка (без кода)

Протестируйте напрямую по адресу novita.ai/models/model-detail/deepseek-deepseek-v4-proДля ознакомления с сервисом не требуется ключ API. Настройте системный запрос для активации режима «Думай» или «Не думай».

Вариант 2: API (Python)

from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="YOUR_NOVITA_API_KEY",
)

# Standard (Think mode)
response = client.chat.completions.create(
    model="deepseek/deepseek-v4-pro",
    messages=[
        {"role": "user", "content": "Implement a Rust async runtime from scratch."}
    ],
)
print(response.choices[0].message.content)

Получите свой ключ API по адресу novita.ai/ настройкиОдин и тот же идентификатор модели подходит для всех трех режимов рассуждений — передавайте инструкции режима в командной строке системы или используйте описанный в DeepSeek синтаксис переключения режимов.

Вариант 3: Сторонние инструменты

С Novita AI Совместимо с OpenAI-API, вы можете его установить. deepseek/deepseek-v4-pro в качестве идентификатора модели в Курсор (специализированный поставщик OpenAI), Клод Код-совместимые конфигурации, Лангчейн, ЛамаИндексили любой другой фреймворк на основе OpenAI SDK. Просто укажите. base_url в https://api.novita.ai/v3/openai.

curl https://api.novita.ai/v3/openai/chat/completions \\
  -H "Authorization: Bearer YOUR_NOVITA_API_KEY" \\
  -H "Content-Type: application/json" \\
  -d '{"model":"deepseek/deepseek-v4-pro","messages":[{"role":"user","content":"Implement a Rust async runtime."}]}'

Случаи использования

Полный анализ и рефакторинг кодовой базы: Благодаря контексту в 1 миллион токенов вы можете передать весь репозиторий среднего размера за один вызов. V4-Pro поможет вам найти архитектурные проблемы, сгенерировать руководства по миграции или выполнить рефакторинг шаблонов в более чем 50 файлах одновременно — без разбиения на части или обходных путей для получения данных.

Соревновательное программирование и сложные алгоритмические задачи: Рейтинг Codeforces 3206 ставит V4-Pro в число лучших алгоритмических задач. Используйте его для генерации решений задач по соревновательному программированию, проверки доказательств сложности или стресс-тестирования граничных случаев в алгоритмах, используемых в производственных условиях.

Агенты по разрешению проблем GitHub: Стандарт SWE-Verified 80.6 ставит V4-Pro на один уровень с Claude Opus 4.6 в плане реального исправления ошибок. В сочетании с вызовом функций и подробным контекстом он позволяет читать описания проблем, просматривать историю кода и генерировать патчи, не теряя при этом из виду большие репозитории.

Рассуждения на основе длинных документов: Юридические контракты, научные статьи, технические спецификации, журналы аудита — контекст V4-Pro объемом 1 млн слов означает, что вам не нужно обобщать или разбивать информацию на блоки перед анализом. CorpusQA 1M (62.0) и MRCR 1M (83.5) подтверждают, что точность поиска сохраняется при полной длине контекста.

Репетиторство по математике и естественным наукам / составление задач: Показатель IMOAnswerBench 89.8 (превосходит все закрытые модели, кроме GPT-5.4 с результатом 91.4) делает V4-Pro отличным выбором для генерации математических задач соревновательного уровня, проверки доказательств или создания инструментов для STEM-образования, где узким местом является математическое мышление.

Цены

МодельВходные данные ($/M токенов)Чтение из кэша ($/Млн токенов)Выходные данные ($/M токенов)
DeepSeek-V4-Pro (Novita)$1.74$0.145$3.48
DeepSeek-V4-Flash (Novita)$0.10-$0.50
Клод Опус 4.6 (Антропный)$15.00$1.50$75.00
Gemini 3.1 Pro (Google)$1.25$0.31$10.00
GPT-5.4 (ОпенАИ)$10.00$2.50$40.00

Последняя проверка: 25.04.2026. Цены Novita от novita.ai/ценыЦены конкурентов: Claude с сайта anthropic.com (непроверено), Gemini с сайта ai.google.dev (непроверено), GPT-5.4 с сайта platform.openai.com (непроверено).

С помощью Novita AIV4-Pro примерно в 8 раз дешевле, чем Claude Opus 4.6, по стоимости входных токенов и в 21 раз дешевле по стоимости выходных. По сравнению с Gemini 3.1 Pro, цены на входные токены схожи, но на выходные они в 2.9 раза дешевле. Для программистов с длинным контекстом и многоэтапными сессиями, где стоимость выходных токенов составляет основную часть затрат, разрыв быстро увеличивается.

Переход с DeepSeek-V3 или DeepSeek-R1

Если вы в настоящее время используете DeepSeek-V3 или R1 на Novita, обновление до V4-Pro осуществляется всего одной строкой кода для изменения идентификатора модели. API совместим с OpenAI, используется та же конечная точка и тот же формат запроса. Три режима рассуждений V4-Pro позволяют гибко воспроизводить как глубокое рассуждение в стиле V3 (без режима «размышления»), так и глубокое рассуждение в стиле R1 (режим Max) из одной модели — без необходимости поддерживать отдельные развертывания. Если вы переходите с модели другого поставщика (GPT-4o, Claude 3.5 и т. д.), направьте существующий клиент OpenAI SDK на base_url="https://api.novita.ai/v3/openai" и поменяйте местами идентификатор модели.

Заключение

Итог: DeepSeek-V4-Pro — это самая мощная модель с открытым исходным кодом, доступная для задач программирования, с однозначно лучшими результатами на LiveCodeBench и Codeforces, и это единственная модель в своем классе, которая обрабатывает контекстное окно, состоящее из 1 миллиона токенов. Она не лидирует во всех бенчмарках — Gemini 3.1 Pro превосходит ее по показателю извлечения знаний, а Claude Opus лидирует по извлечению длинного контекста, — но для команд, создающих агентов программирования, решающих проблемы GitHub в больших масштабах или обрабатывающих огромные документы, V4-Pro обеспечивает производительность передового уровня при значительно меньших затратах по сравнению с API закрытых моделей. Теперь доступна при поддержке Novita AI — Более 200 API для моделей и инфраструктура, совместимая с OpenAI.

FAQ

Что такое DeepSeek-V4-Pro?

DeepSeek-V4-Pro — это языковая модель от DeepSeek AI, насчитывающая 1.6 триллиона параметров и представляющая собой смесь экспертов (Mixture-of-Experts), выпущенная в апреле 2026 года. Она активирует 49 миллиардов параметров за один проход, поддерживает 1 048 576 контекстных токенов и в настоящее время лидирует среди всех публично оцененных моделей на LiveCodeBench (93.5) и Codeforces Rating (3206). Она доступна под лицензией MIT и через Novita AI.

Как получить доступ к DeepSeek-V4-Pro через API?

Используйте идентификатор модели deepseek/deepseek-v4-pro с base_url="https://api.novita.ai/v3/openai" и ваш API-ключ Novita от novita.ai/ настройкиДанная конечная точка совместима с OpenAI SDK — никаких дополнительных SDK не требуется.

Чем DeepSeek-V4-Pro отличается от Claude Opus 4.6 и Gemini 3.1 Pro?

V4-Pro лидирует в тестах на программирование: LiveCodeBench 93.5 (против Opus 4.6 88.8, Gemini 91.7) и Codeforces 3206 (против Gemini 3052). В тестах на знание информации, таких как GPQA Diamond и HLE, лидирует Gemini 3.1 Pro. В тестах на поиск информации в длинном контексте (MRCR 1M) лидирует Claude Opus. V4-Pro — лучший выбор среди программ с открытым исходным кодом для задач, требующих интенсивного программирования и работы с агентами — закрытые модели сохраняют преимущество в точности фактического извлечения информации.

Что представляет собой контекстное окно DeepSeek-V4-Pro?

1 048 576 токенов (1 млн). Модель специально разработана для эффективной работы с длинным контекстом с использованием гибридного механизма внимания (CSA + HCA). MRCR 1M показывает результат 83.5, а CorpusQA 1M — 62.0, что подтверждает приемлемую точность поиска при полной длине контекста.

Сколько стоит DeepSeek-V4-Pro, на который распространяется гарантия? Novita AI?

$1.74/млн входных токенов, $3.48/млн выходных токенов, $0.145/млн операций чтения из кэша. Это делает его примерно в 8 раз дешевле, чем Claude Opus 4.6, для входящих операций и в 21 раз дешевле для исходящих. Последняя проверка: 25.04.2026.



Узнайте больше от Novita

Подпишитесь, чтобы получать последние публикации на вашу электронную почту.

Оставьте комментарий

Наверх

Узнайте больше от Novita

Подпишитесь сейчас, чтобы продолжить чтение и получить доступ к полному архиву.

Подробнее