В Novita AI мы рады сообщить, что наша модель DeepSeek была обновлена для поддержки длины контента 160K — значительное улучшение по сравнению с предыдущим лимитом 128K. Это обновление означает, что теперь вы можете обрабатывать и анализировать ещё большие наборы данных за один раз, экономя время и повышая эффективность. В ограниченный период времени новые пользователи могут получить 10 долларов бесплатных кредитов, чтобы опробовать обновлённые модели DeepSeek и различные другие API LLM на Novita AI.
DeepSeek-R1-0528
Введение
DeepSeek R1 0528 был запущен 28 мая 2025 года как открытая большая модель с примерно 685 миллиардами параметров. Он использует архитектуру Mixture-of-Experts (MoE), активируя около 37 миллиардов параметров на токен во время вывода. Модель поддерживает максимальную длину контекста 128K токенов.
Модель превосходно справляется с чатом, рассуждением, кодированием, математикой и вызовом функций, с дополнительной поддержкой вывода в формате JSON и интерфейсов вызова функций, что значительно расширяет её способность обрабатывать сложные задачи. Она обучена на более чем 10 триллионах токенов, включая веб-контент, код, математические данные и документы, с особым упором на двуязычные возможности на английском и китайском языках.
Обучение включало традиционное обучение с подкреплением на основе обратной связи от человека (RLHF) и методы точной настройки в сочетании со значительными вычислительными ресурсами и алгоритмическими оптимизациями на более поздних этапах. Такой подход ставит точность и надёжность выше эффективности, что делает модель хорошо подходящей для корпоративных приложений, особенно тех, которые требуют сложных рассуждений и высокой точности.
Бенчмарк

DeepSeek-V3-0324
Введение
DeepSeek V3 0324 был запущен 25 марта 2025 года как открытая большая модель с примерно 671 миллиардом параметров, активирующая около 37 миллиардов параметров на токен во время вывода. Модель использует архитектуру Mixture-of-Experts (MoE) и поддерживает максимальную длину контекста 160K токенов, что делает её высокоспособной обрабатывать сверхдлинные входные данные и генерировать расширенные выходные данные.
Модель предназначена для превосходного выполнения таких задач, как многооборотные диалоги, глубокие рассуждения, генерация кода и решение математических задач. Улучшенная многоязычная поддержка, особенно для китайского языка, и тексто-текстовые мультимодальные возможности дополнительно расширяют её универсальность. Обучающие данные включают 14,8 триллионов токенов из разнообразных источников, таких как веб-контент, кодовые базы и технические документы, что обеспечивает надёжную базу знаний для сложных приложений.
DeepSeek V3 0324 использует передовые методы предварительного обучения и пост-обучающую точную настройку, адаптированную для конкретных случаев использования. Этот комплексный подход, наряду с обширными вычислительными ресурсами, ставит точность, связность и надёжность во главу угла, что делает модель идеальной для отраслей, требующих создания длинного контента, решения сложных задач и производительности корпоративного уровня.
Бенчмарк

Длина контента
Что такое длина контента?
В контексте моделей ИИ, таких как DeepSeek, длина контента означает максимальное количество токенов (слов, знаков препинания или символов), которое модель может обработать и сгенерировать за одно взаимодействие. Она определяет, сколько входных данных модель может понять за раз и сколько выходных данных она может произвести. Большее окно контекста позволяет модели ИИ обрабатывать более длинные входные данные и включать больше информации в каждый выходной результат.
Как длина контента влияет на производительность?
Длина контента существенно влияет на способность модели:
- Понимать контекст: Более длинные окна контекста позволяют модели ссылаться на больше информации из входных данных, снижая вероятность потери критически важных деталей.
- Генерировать связные выходные данные: Имея доступ к полному контексту, модель может создавать ответы, которые сохраняют логическую последовательность на протяжении длинных выходных данных.
- Выполнять сложные рассуждения: Задачи, требующие многошаговых рассуждений или отслеживания исторических состояний, такие как кодирование, технический анализ или углублённые исследования, значительно выигрывают от расширенного контекста.
Преимущества расширения до 160K токенов
Благодаря недавнему обновлению DeepSeek-V3-0324 и DeepSeek-R1-0528 теперь поддерживают лимит в 160K токенов, что является значительным скачком по сравнению с предыдущим окном контекста в 128K. Это расширение даёт несколько ключевых преимуществ:
- Поддержка сверхдлинных разговоров: Расширенное окно контекста позволяет вести непрерывные многооборотные диалоги без потери нити предыдущих взаимодействий, что идеально подходит для задач, требующих долгосрочной согласованности и памяти.
- Облегчение глубокого анализа агентов: Агенты теперь могут анализировать большие наборы данных или проводить более глубокие рассуждения в течение длительного времени, открывая новые возможности для таких приложений, как бизнес-аналитика или научные исследования.
- Создание приложений с длинными выходными данными: Такие задачи, как генерация кода, суммирование документов или создание подробных отчётов, теперь могут обрабатывать более крупные и сложные входные данные, предоставляя комплексные результаты за один вывод.
Расширяя длину контента, DeepSeek теперь лучше оснащён для удовлетворения требований современных рабочих процессов, что делает его мощным инструментом для пользователей в различных отраслях.
Доступ к DeepSeek через Novita AI
Шаг 1: Войдите в систему и откройте библиотеку моделей
Войдите в свой аккаунт и нажмите кнопку Model Library.

Шаг 2: Выберите свою модель
Просмотрите доступные варианты и выберите модель, которая соответствует вашим потребностям.

Шаг 3: Начните бесплатную пробную версию
Начните бесплатную пробную версию, чтобы изучить возможности выбранной модели.

Шаг 4: Получите свой API-ключ
Для аутентификации через API мы предоставим вам новый API-ключ. Перейдите на страницу «Settings», чтобы скопировать API-ключ, как показано на изображении.

Шаг 5: Установите API
Установите API с помощью менеджера пакетов, соответствующего вашему языку программирования.

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с Novita AI LLM. Это пример использования chat completions API для пользователей Python для доступа к DeepSeek R1 0528.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="session_r5eB9eC3oBfDyuGn69eevTLAudts6AFa3JeHeml91oVyVe6uZnGUmAh7aO9rZxUSRocPWUBszQaiC39g4VGiAg==",
)
model = "deepseek/deepseek-r1-0528"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Novita AI предлагает как DeepSeek R1 0528, так и DeepSeek V3 0324 с расширенной длиной контекста, что позволяет обрабатывать более длительные разговоры и более сложные проекты. При цене DeepSeek R1 0528 всего $0.7/$2.5 за 1M входных/выходных токенов и DeepSeek V3 0324 по ещё более доступной цене $0.28/$1.14 за 1M токенов, вы можете получить доступ к передовым возможностям ИИ, не выходя за рамки бюджета. В ограниченный период времени новые пользователи могут получить 10 долларов бесплатных кредитов, чтобы опробовать обновлённые модели DeepSeek и различные другие API LLM на Novita AI.
Часто задаваемые вопросы
Что такое DeepSeek V3 0324?
DeepSeek V3 0324 — это современная большая языковая модель от DeepSeek, предназначенная для обычных разговоров, понимания и продвинутых рассуждений.
Как расширенная длина контекста помогает в проектах по кодированию?
Благодаря расширенному контексту вы можете делиться целыми кодовыми базами, сохранять контекст между несколькими файлами и работать над сложными задачами рефакторинга, не теряя зависимостей и взаимосвязей между различными частями вашего кода. Это значительно улучшает способность ИИ предоставлять точные и контекстуально релевантные предложения.
Какая длина контекста хороша для LLM?
Для большинства приложений 32K–128K токенов обеспечивают отличную производительность, а обновлённая длина контекста 160K от Novita AI гарантирует, что вы сможете обрабатывать даже самые сложные документы и длительные разговоры без каких-либо ограничений.
О Novita AI
Novita AI — это облачная платформа ИИ, которая предоставляет разработчикам простой способ развёртывания моделей ИИ с помощью нашего простого API, а также предлагает доступное и надёжное GPU-облако для создания собственных решений.
