DeepSeek V3 и R1 обновлены: контекст и вывод до 160K токенов по более низкой цене

DeepSeek V3 и R1 обновлены: контекст и вывод до 160K токенов по более низкой цене

В Novita AI мы рады сообщить, что наша модель DeepSeek была обновлена для поддержки длины контента 160K — значительное улучшение по сравнению с предыдущим лимитом 128K. Это обновление означает, что теперь вы можете обрабатывать и анализировать ещё большие наборы данных за один раз, экономя время и повышая эффективность. В ограниченный период времени новые пользователи могут получить 10 долларов бесплатных кредитов, чтобы опробовать обновлённые модели DeepSeek и различные другие API LLM на Novita AI.

DeepSeek-R1-0528

Введение

DeepSeek R1 0528 был запущен 28 мая 2025 года как открытая большая модель с примерно 685 миллиардами параметров. Он использует архитектуру Mixture-of-Experts (MoE), активируя около 37 миллиардов параметров на токен во время вывода. Модель поддерживает максимальную длину контекста 128K токенов.

Модель превосходно справляется с чатом, рассуждением, кодированием, математикой и вызовом функций, с дополнительной поддержкой вывода в формате JSON и интерфейсов вызова функций, что значительно расширяет её способность обрабатывать сложные задачи. Она обучена на более чем 10 триллионах токенов, включая веб-контент, код, математические данные и документы, с особым упором на двуязычные возможности на английском и китайском языках.

Обучение включало традиционное обучение с подкреплением на основе обратной связи от человека (RLHF) и методы точной настройки в сочетании со значительными вычислительными ресурсами и алгоритмическими оптимизациями на более поздних этапах. Такой подход ставит точность и надёжность выше эффективности, что делает модель хорошо подходящей для корпоративных приложений, особенно тех, которые требуют сложных рассуждений и высокой точности.

Бенчмарк

Сравнение бенчмарков DeepSeek R1 0528

DeepSeek-V3-0324

Введение

DeepSeek V3 0324 был запущен 25 марта 2025 года как открытая большая модель с примерно 671 миллиардом параметров, активирующая около 37 миллиардов параметров на токен во время вывода. Модель использует архитектуру Mixture-of-Experts (MoE) и поддерживает максимальную длину контекста 160K токенов, что делает её высокоспособной обрабатывать сверхдлинные входные данные и генерировать расширенные выходные данные.

Модель предназначена для превосходного выполнения таких задач, как многооборотные диалоги, глубокие рассуждения, генерация кода и решение математических задач. Улучшенная многоязычная поддержка, особенно для китайского языка, и тексто-текстовые мультимодальные возможности дополнительно расширяют её универсальность. Обучающие данные включают 14,8 триллионов токенов из разнообразных источников, таких как веб-контент, кодовые базы и технические документы, что обеспечивает надёжную базу знаний для сложных приложений.

DeepSeek V3 0324 использует передовые методы предварительного обучения и пост-обучающую точную настройку, адаптированную для конкретных случаев использования. Этот комплексный подход, наряду с обширными вычислительными ресурсами, ставит точность, связность и надёжность во главу угла, что делает модель идеальной для отраслей, требующих создания длинного контента, решения сложных задач и производительности корпоративного уровня.

Бенчмарк

Сравнение бенчмарков DeepSeek V3 0324

Длина контента

Что такое длина контента?

В контексте моделей ИИ, таких как DeepSeek, длина контента означает максимальное количество токенов (слов, знаков препинания или символов), которое модель может обработать и сгенерировать за одно взаимодействие. Она определяет, сколько входных данных модель может понять за раз и сколько выходных данных она может произвести. Большее окно контекста позволяет модели ИИ обрабатывать более длинные входные данные и включать больше информации в каждый выходной результат.

Как длина контента влияет на производительность?

Длина контента существенно влияет на способность модели:

  • Понимать контекст: Более длинные окна контекста позволяют модели ссылаться на больше информации из входных данных, снижая вероятность потери критически важных деталей.
  • Генерировать связные выходные данные: Имея доступ к полному контексту, модель может создавать ответы, которые сохраняют логическую последовательность на протяжении длинных выходных данных.
  • Выполнять сложные рассуждения: Задачи, требующие многошаговых рассуждений или отслеживания исторических состояний, такие как кодирование, технический анализ или углублённые исследования, значительно выигрывают от расширенного контекста.

Преимущества расширения до 160K токенов

Благодаря недавнему обновлению DeepSeek-V3-0324 и DeepSeek-R1-0528 теперь поддерживают лимит в 160K токенов, что является значительным скачком по сравнению с предыдущим окном контекста в 128K. Это расширение даёт несколько ключевых преимуществ:

  1. Поддержка сверхдлинных разговоров: Расширенное окно контекста позволяет вести непрерывные многооборотные диалоги без потери нити предыдущих взаимодействий, что идеально подходит для задач, требующих долгосрочной согласованности и памяти.
  2. Облегчение глубокого анализа агентов: Агенты теперь могут анализировать большие наборы данных или проводить более глубокие рассуждения в течение длительного времени, открывая новые возможности для таких приложений, как бизнес-аналитика или научные исследования.
  3. Создание приложений с длинными выходными данными: Такие задачи, как генерация кода, суммирование документов или создание подробных отчётов, теперь могут обрабатывать более крупные и сложные входные данные, предоставляя комплексные результаты за один вывод.

Расширяя длину контента, DeepSeek теперь лучше оснащён для удовлетворения требований современных рабочих процессов, что делает его мощным инструментом для пользователей в различных отраслях.

Доступ к DeepSeek через Novita AI

Шаг 1: Войдите в систему и откройте библиотеку моделей

Войдите в свой аккаунт и нажмите кнопку Model Library.

Войдите в систему и откройте библиотеку моделей

Шаг 2: Выберите свою модель

Просмотрите доступные варианты и выберите модель, которая соответствует вашим потребностям.

выберите свою модель

Шаг 3: Начните бесплатную пробную версию

Начните бесплатную пробную версию, чтобы изучить возможности выбранной модели.

начните бесплатную пробную версию DeepSeek R1 0528

Попробуйте DeepSeek сейчас

Шаг 4: Получите свой API-ключ

Для аутентификации через API мы предоставим вам новый API-ключ. Перейдите на страницу «Settings», чтобы скопировать API-ключ, как показано на изображении.

получите API-ключ

Шаг 5: Установите API

Установите API с помощью менеджера пакетов, соответствующего вашему языку программирования.

установите API

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с Novita AI LLM. Это пример использования chat completions API для пользователей Python для доступа к DeepSeek R1 0528.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="session_r5eB9eC3oBfDyuGn69eevTLAudts6AFa3JeHeml91oVyVe6uZnGUmAh7aO9rZxUSRocPWUBszQaiC39g4VGiAg==",
)

model = "deepseek/deepseek-r1-0528"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

Novita AI предлагает как DeepSeek R1 0528, так и DeepSeek V3 0324 с расширенной длиной контекста, что позволяет обрабатывать более длительные разговоры и более сложные проекты. При цене DeepSeek R1 0528 всего $0.7/$2.5 за 1M входных/выходных токенов и DeepSeek V3 0324 по ещё более доступной цене $0.28/$1.14 за 1M токенов, вы можете получить доступ к передовым возможностям ИИ, не выходя за рамки бюджета. В ограниченный период времени новые пользователи могут получить 10 долларов бесплатных кредитов, чтобы опробовать обновлённые модели DeepSeek и различные другие API LLM на Novita AI.

Часто задаваемые вопросы

Что такое DeepSeek V3 0324?

DeepSeek V3 0324 — это современная большая языковая модель от DeepSeek, предназначенная для обычных разговоров, понимания и продвинутых рассуждений.

Как расширенная длина контекста помогает в проектах по кодированию?

Благодаря расширенному контексту вы можете делиться целыми кодовыми базами, сохранять контекст между несколькими файлами и работать над сложными задачами рефакторинга, не теряя зависимостей и взаимосвязей между различными частями вашего кода. Это значительно улучшает способность ИИ предоставлять точные и контекстуально релевантные предложения.

Какая длина контекста хороша для LLM?

Для большинства приложений 32K–128K токенов обеспечивают отличную производительность, а обновлённая длина контекста 160K от Novita AI гарантирует, что вы сможете обрабатывать даже самые сложные документы и длительные разговоры без каких-либо ограничений.

О Novita AI

Novita AI — это облачная платформа ИИ, которая предоставляет разработчикам простой способ развёртывания моделей ИИ с помощью нашего простого API, а также предлагает доступное и надёжное GPU-облако для создания собственных решений.