DeepSeek V3.2 в Claude Code для решения проблем с длинным контекстом при генерации кода

DeepSeek V3.2 в Claude Code для решения проблем с длинным контекстом при генерации кода

Разработчики, работающие с большими кодовыми базами или многодокументными рабочими процессами, сталкиваются с постоянными проблемами: высокая вычислительная стоимость, нестабильная производительность при работе с длинным контекстом и непонимание кода при использовании обычных моделей Transformer. Эти ограничения снижают эффективность итераций, ограничивают анализ в масштабе репозитория и увеличивают операционные расходы. Появление DeepSeek V3.2 решает эти проблемы за счет интеграции разреженного внимания DeepSeek (DSA, DeepSeek Sparse Attention) — механизма, разработанного для снижения накладных расходов на внимание, ускорения контекстного рассуждения и стабилизации генерации кода.

В этой статье рассматривается, как DeepSeek V3.2 повышает экономическую эффективность, обработку длинного контекста и возможности, ориентированные на работу с кодом. Также представлено практическое руководство по развертыванию DeepSeek V3.2 через Novita AI и Claude Code.

Внимание! Novita AI запускает кампанию «Месяц разработки», предлагая разработчикам эксклюзивную скидку до 20% на все основные продукты!

Внимание! Novita AI запускает кампанию «Месяц разработки», предлагая разработчикам эксклюзивную скидку до 20% на все основные продукты!

Участвовать в «Месяце разработки»!

Какие новые функции для работы с кодом появились в DeepSeek V3.2?

DSA — это революционный механизм внимания, который кардинально меняет способ обработки информации моделью. В то время как обычные Transformer требуют, чтобы каждый токен обращал внимание на все остальные токены, что приводит к квадратичной вычислительной стоимости (O(n²)), DSA внедряет тонкий механизм выбора, учитывающий содержание:

  • Интеллектуальная фильтрация: Во время обучения модель учится определять, какие связи между токенами действительно важны для конкретных задач
  • Динамические соединения: Выбор необходимых связей внимания в реальном времени на основе содержания входных данных.
  • Оптимизация под задачи: Фокусируется на разных структурных паттернах при обработке кода и юридических документов

Три ключевых улучшения, обеспечиваемых DSA

Прямая самоадаптация используется как вспомогательный механизм для повышения общей производительности модели без изменения базовой архитектуры. Благодаря этому подходу модель достигает значительной экономической эффективности за счет более дешевого инференса, сохраняя при этом качество генерации и анализа кода, сопоставимое с версией v3.1, что поддерживает частое тестирование и быстрые итерации.

DSA также усиливает использование длинного контекста за счет эффективного применения окна контекста до 128K токенов, что улучшает одновременный анализ нескольких файлов, понимание зависимостей между файлами и обработку сложной технической документации.

Кроме того, DSA способствует улучшению возможностей, связанных с кодом: более быстрый ответ при инференсе, более точное понимание кода и более стабильное качество генерации кода, что в совокупности повышает надежность и эффективность модели в сценариях крупномасштабной разработки программного обеспечения.

Масштабируемый фреймворк обучения с подкреплением

Благодаря использованию надежного протокола обучения с подкреплением и масштабированию вычислений после обучения DeepSeek-V3.2 достигает производительности, сопоставимой с GPT-5. Примечательно, что высокопроизводительный вариант DeepSeek-V3.2-Speciale стабильно превосходит GPT-5 и демонстрирует возможности рассуждения на уровне Gemini-3.0-Pro.

Бенчмарк Метрика DeepSeek-V3.2-Speciale DeepSeek-V3.2-Thinking GPT-5-High Claude-4.5-Sonnet Gemini-3.0-Pro
AIME 2025 Pass@1 (%) 96.0 93.1 94.6 87.0 95.0
HMMT 2025 Pass@1 (%) 99.2 90.2 88.3 79.2 97.5
HLE Pass@1 (%) 30.6 25.1 26.3 13.7 37.7
Codeforces Рейтинг 2701 2386 2537 1480 2708
SWE Verified Решено (%) 73.1 74.9 77.2 76.2
Terminal Bench 2.0 Точность (%) 46.4 35.2 42.8 54.2
τ² Bench Pass@1 (%) 80.3 80.2 84.7 85.4
Tool Decathlon Pass@1 (%) 35.2 29.0 38.6 36.4

Попробуйте DeepSeek V3.2 со скидкой 20%!

DeepSeek V3.2: Что сделано для улучшения взаимодействия с разработчиками?

Чтобы лучше интегрировать рассуждение в сценарии использования инструментов, DeepSeek внедрила конвейер синтеза агентных задач крупного масштаба на этапе пост-обучения V3.2. Основная идея — систематически генерировать агентные обучающие данные в большом объеме, вместо того чтобы полагаться на ручные промпты или ограниченные демонстрации человека.

Этот конвейер программно создает задачи, требующие от модели рассуждать, принимать решения, вызывать инструменты, наблюдать промежуточные результаты и соответствующим образом корректировать свое поведение. Обучая модель на широком разнообразии структурированных взаимодействий, DeepSeek обеспечивает масштабируемое пост-обучение для агентов, значительно улучшая как соответствие поведению, так и обобщение в сложных многошаговых интерактивных средах, таких как поиск, программирование и рабочие процессы с расширением инструментами.

Два самых важных обновления:

Переработанный формат вызова инструментов, разработанный для большей явности и стабильности в многошаговых взаимодействиях

Нативная поддержка «рассуждения с инструментами», при которой рассуждение и использование инструментов структурно интегрированы, а не свободно переплетаются

Чтобы помочь сообществу понять и принять этот новый шаблон, DeepSeek предоставляет специальную папку encoding. В этой папке находятся Python-скрипты и тестовые случаи, которые демонстрируют: как кодировать совместимые с OpenAI сообщения в единую входную строку, ожидаемую DeepSeek-V3.2, и как парсить текстовый вывод модели обратно в структурированные сообщения.

import transformers
# encoding/encoding_dsv32.py
from encoding_dsv32 import encode_messages, parse_message_from_completion_text

tokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")

messages = [
    {"role": "user", "content": "hello"},
    {"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."},
    {"role": "user", "content": "1+1=?"}
]
encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)

prompt = encode_messages(messages, **encode_config)
tokens = tokenizer.encode(prompt)

Стоит отметить, что в этом релизе отсутствует чат-шаблон на основе Jinja. Представленная реализация на Python является авторитетным эталоном. Кроме того, функция парсинга вывода предполагает, что вывод модели имеет корректный формат, и предназначена для демонстрации и экспериментов, а не для прямого использования в продакшене без дополнительной обработки ошибок.

Попробуйте DeepSeek V3.2 со скидкой 20%!

Зачем нужна роль developer

В реальных сценариях работы агентов модель часто должна одновременно обрабатывать три отдельных типа информации:

  • Реальное намерение пользователя или целевая задача
  • Собственный процесс рассуждений и принятия решений модели
  • Стратегии поиска, ограничения инструментов и правила выполнения, предоставляемые системой или разработчиком

В более ранних версиях эти сигналы обычно смешивались в пользовательских или системных промптах. Со временем это привело к двум серьезным проблемам. Во-первых, модель могла испытывать трудности с разделением намерения пользователя и обязательных поведенческих ограничений. Во-вторых, по мере усложнения цепочек инструментов стабильность и надежность вызова инструментов заметно снижалась.

Роль developer, представленная в DeepSeek-V3.2, по сути является выделенным каналом управления для поисковых агентов и агентов, ориентированных на работу с инструментами. Она предназначена для передачи инструкций, строго связанных с поведением агента: таких как область поиска, порядок использования инструментов или политические ограничения, не участвуя при этом в обычной разговорной семантике. Это явное разделение обеспечивает более четкое понимание контекста и создает структурную основу для более масштабируемого и надежного обучения агентов.

Как получить доступ к DeepSeek V3.2 в Claude Code?

В настоящее время Novita AI предлагает самый доступный API DeepSeek V3.2 с полным контекстом.

Novita AI предоставляет API с контекстом 65K и стоимостью $0.269 за входной токен и $0.4 за выходной токен, с поддержкой структурированного вывода и вызова функций, что обеспечивает надежную поддержку для максимального раскрытия потенциала код-агента DeepSeek V3.2.

Чтение из кэша: $0.1345 за миллион токенов — это стоимость чтения кэшированных токенов при попадании в кэш. Эти токены были ранее вычислены и сохранены, поэтому дополнительный инференс модели не требуется. В системах, где множество запросов используют один и тот же префикс промпта, повторно используют историю диалогов, инструкции для инструментов или фиксированные тексты правил, или где результаты поиска RAG очень повторяются, можно достичь высокого процента попаданий в кэш, что значительно снижает общую стоимость инференса.

Попробуйте DeepSeek V3.2 со скидкой 20%!

Шаг 1: Получите API-ключ

Шаг 1: Войдите в свой аккаунт и нажмите кнопку «Библиотека моделей».

Вход в аккаунт и доступ к библиотеке моделей

Шаг 2: Выберите модель

Просмотрите доступные варианты и выберите модель, подходящую для ваших задач.

Просмотрите доступные варианты и выберите модель, подходящую для ваших задач.

Шаг 3: Начните бесплатный пробный период

Начните бесплатный пробный период, чтобы изучить возможности выбранной модели.

Шаг 4: Получите API-ключ

Для аутентификации через API мы предоставим вам новый API-ключ. Перейдите на страницу «Настройки», чтобы скопировать API-ключ, как показано на изображении.

получить api ключ

Шаг 5: Установите API

Установите API с помощью менеджера пакетов, соответствующего вашему языку программирования.

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с помощью вашего API-ключа, чтобы начать взаимодействие с Novita AI LLM. Ниже приведен пример использования API завершений чата для пользователей Python.

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v3.2",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=65536,
    temperature=0.7
)

print(response.choices[0].message.content)

Использование DeepSeek V3.2 с Claude Code

Шаг 1: Установка Claude Code

Перед установкой Claude Code убедитесь, что ваша система соответствует минимальным требованиям. На вашем локальном устройстве должен быть установлен Node.js версии 18 или выше. Проверить версию Node.js можно, выполнив команду node --version в терминале.

Для Windows Откройте командную строку и выполните следующие команды:

npm install -g @anthropic-ai/claude-code
npx win-claude-code@latest

Глобальная установка обеспечивает доступность Claude Code из любого каталога вашей системы. Команда npx win-claude-code@latest загружает и запускает последнюю версию, специфичную для Windows.

Для Mac и Linux Откройте терминал и выполните:

npm install -g @anthropic-ai/claude-code

Пользователи Mac могут сразу перейти к глобальной установке без дополнительных команд, специфичных для платформы. Процесс установки автоматически настраивает необходимые зависимости и переменные PATH.

Шаг 2: Настройка переменных окружения

Переменные окружения настраивают Claude Code на использование DeepSeek V3.2 через конечные точки API Novita AI. Эти переменные сообщают Claude Code, куда отправлять запросы и как проходить аутентификацию.

Для Windows Откройте командную строку и задайте следующие переменные окружения:

set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API Key>
set ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
set ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"

Замените <Novita API Key> на ваш фактический API-ключ, полученный на платформе Novita AI. Эти переменные остаются активными в течение текущей сессии и должны быть заданы заново, если вы закроете командную строку.

Для Mac и Linux Откройте терминал и экспортируйте следующие переменные окружения:

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
export ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"

Шаг 3: Запуск Claude Code

После завершения установки и настройки вы можете запустить Claude Code в каталоге вашего проекта. Перейдите в нужное вам расположение проекта с помощью команды cd:

cd <your-project-directory>
claude .

Параметр точка (.) указывает Claude Code работать в текущем каталоге. При запуске вы увидите приглашение Claude Code в интерактивной сессии. Это означает, что инструмент готов получать ваши инструкции. Интерфейс предоставляет чистую, интуитивно понятную среду для взаимодействия с программированием на естественном языке.

Шаг 4: Использование Claude Code в VSCode или Cursor

Claude Code seamlessly интегрируется с популярными средами разработки. Он улучшает ваш существующий рабочий процесс, а не заменяет его. Вы можете использовать Claude Code напрямую в терминале внутри VSCode или Cursor. Это сохраняет доступ к привычным инструментам разработки при использовании AI-помощника. Кроме того, для VSCode и Cursor доступны плагины Claude Code.

Как использовать внешние модели в Claude Code

Если вы хотите динамически переключаться между разными большими языковыми моделями (например, Claude от Anthropic, GLM от Zhipu и Kimi от Moonshot) в вашем рабочем процессе разработки, существуют стратегии для этого без внесения больших изменений в код. В этом разделе объясняется, как быстро подменять модели с помощью унифицированных API и переключателей конфигурации.

Использование переменных окружения (подход Claude Code): Если вы работаете с инструментами вроде Claude Code или SDK, привязанным к конкретному API, вы можете переключать модели просто путем настройки переменных окружения. Novita AI предоставляет несколько вариантов моделей, которые вы можете протестировать, чтобы найти наиболее подходящую. Novita AI предоставляет несколько вариантов моделей, которые вы можете протестировать, чтобы найти наиболее подходящую. Посмотреть другие модели сейчас!

DeepSeek V3.2 внедряет DSA как целевое архитектурное обновление, которое существенно снижает вычислительную стоимость, повышает эффективность работы с длинным контекстом и улучшает точность в задачах, связанных с кодом, сохраняя при этом конкурентоспособную производительность рассуждений. Модель обеспечивает масштабируемый анализ больших репозиториев и сложной технической документации, демонстрируя благоприятный баланс между эффективностью и возможностями по сравнению с DeepSeek V3.1-Terminus и проприетарными альтернативами. Эти улучшения делают DeepSeek V3.2 экономически эффективным решением для стабильных рабочих процессов разработки и AI-приложений с длинным контекстом.

Часто задаваемые вопросы

Каково основное преимущество разреженного внимания DeepSeek (DSA) в DeepSeek V3.2? DeepSeek V3.2 использует DSA для выборочной активации связей внимания, снижая квадратичную стоимость внимания и сохраняя при этом точное понимание кода в длинном контексте.

Чем DeepSeek V3.2 отличается от DeepSeek V3.1-Terminus в практических рабочих процессах программирования? DeepSeek V3.2 обеспечивает более низкие операционные расходы, окно контекста 128K и более стабильный быстрый инференс по сравнению с DeepSeek V3.1-Terminus, что приводит к более эффективному анализу кода в масштабе репозитория.

Улучшает ли DeepSeek V3.2 обработку технической документации с длинным контекстом? Да. DeepSeek V3.2 поддерживает одновременный анализ сложных документов и межфайловых зависимостей, превосходя DeepSeek V3.1-Terminus в задачах рассуждения по нескольким документам.

Novita AI — это универсальная облачная платформа, которая помогает реализовать ваши AI-амбиции. Интегрированные API, бессерверные вычисления, GPU-инстансы — доступные инструменты, которые вам нужны. Избавьтесь от инфраструктуры, начните бесплатно и воплотите ваше AI-видение в реальность.

Рекомендуемые материалы

Как получить доступ к Qwen 3 Coder: Qwen Code, Claude Code, Trae

DeepSeek против Qwen: Определите, какая экосистема подходит для продакшена

Стоимость DeepSeek R1 0528: сравнение API, GPU и локального развертывания