DeepSeek V3.2 在 Claude Code 中解决长上下文编码瓶颈

DeepSeek V3.2 在 Claude Code 中解决长上下文编码瓶颈

管理大型代码库或多文档工作流的开发者在传统Transformer模型中持续面临挑战,包括高计算成本、不稳定的长上下文性能以及不一致的代码理解。这些限制降低了迭代效率,限制了仓库级分析,并增加了运营开支。DeepSeek V3.2 的推出通过集成 DeepSeek 稀疏注意力(DSA) 解决了这些痛点,DSA 是一种旨在降低注意力开销、加速上下文推理并稳定代码生成的机制。

本文探讨了 DeepSeek V3.2 如何提升成本效率、长上下文处理和专注代码的能力。本文还提供了通过 Novita AI 和 Claude Code 部署 DeepSeek V3.2 的操作指南。

请注意!Novita AI 正在推出其“Build Month”活动,为开发者提供所有主要产品高达 8 折的专属优惠!

请注意!Novita AI 正在推出其“Build Month”活动,为开发者提供所有主要产品高达 8 折的专属优惠!

立即参与 Build Month!

DeepSeek V3.2 中有哪些新的编码功能?

DSA 是一种革命性的注意力机制,从根本上改变了模型处理信息的方式。传统 Transformer 要求每个 token 关注所有其他 token(导致二次计算成本 O(n²)),而 DSA 引入了一种细粒度的、基于内容的选择机制:

  • 智能过滤:在训练过程中,模型学习识别哪些 token 关系对特定任务真正重要。
  • 动态连接:根据输入内容实时选择必要的注意力连接。
  • 任务优化:处理代码与法律文档时关注不同的结构模式。

DSA 带来的三大核心改进

直接自适应被用作辅助机制,以在不改变核心架构的情况下增强整体模型性能。通过这种方法,该模型在实现更经济的推理同时,保持了与 v3.1 相当的代码生成和分析质量,从而支持频繁测试和快速迭代。

DSA 还通过有效利用高达 128K token 的上下文窗口来增强长上下文利用能力,从而改进了同时进行多文件分析、跨文件依赖理解以及处理复杂技术文档的能力。

此外,DSA 有助于提升与代码相关的能力,包括更快的推理响应、更准确的代码理解以及更稳定的代码生成质量,从而共同提高了模型在大型软件开发场景中的可靠性和效率。

可扩展的强化学习框架

通过采用强健的强化学习协议并扩展训练后计算量,DeepSeek-V3.2 实现了与 GPT-5 相当的性能。值得注意的是,高计算变体 DeepSeek-V3.2-Speciale 持续优于 GPT-5,并展现出与 Gemini-3.0-Pro 相当的推理能力。

基准 指标 DeepSeek-V3.2-Speciale DeepSeek-V3.2-Thinking GPT-5-High Claude-4.5-Sonnet Gemini-3.0-Pro
AIME 2025 Pass@1 (%) 96.0 93.1 94.6 87.0 95.0
HMMT 2025 Pass@1 (%) 99.2 90.2 88.3 79.2 97.5
HLE Pass@1 (%) 30.6 25.1 26.3 13.7 37.7
Codeforces Rating 2701 2386 2537 1480 2708
SWE Verified Resolved (%) 73.1 74.9 77.2 76.2
Terminal Bench 2.0 Accuracy (%) 46.4 35.2 42.8 54.2
τ² Bench Pass@1 (%) 80.3 80.2 84.7 85.4
Tool Decathlon Pass@1 (%) 35.2 29.0 38.6 36.4

立即试用 8 折 Deepseek V3.2!

DeepSeek V3.2:如何更好地与开发者协作?

为了更好地将推理集成到工具使用场景中,DeepSeek 在 V3.2 的训练后阶段引入了 大规模智能体任务合成流水线。核心思想是系统地大规模生成智能体训练数据,而不是依赖于手工设计的提示或有限的人类演示。

该流水线以编程方式构建任务,要求模型推理、决策、调用工具、观察中间结果并相应调整行为。通过让模型接触各种结构化交互,DeepSeek 实现了可扩展的智能体后训练,在复杂的多步交互环境(如搜索、编码和工具增强工作流)中显著提高了行为合规性和泛化能力。

两个最重要的更新是:

修订后的 工具调用格式,设计得更明确,在多步交互中更稳定

原生支持 “带工具的思考”,其中推理和工具使用在结构上集成,而不是松散地交错排列

为了帮助社区理解并采用这一新模板,DeepSeek 提供了一个专门的 encoding 文件夹。该文件夹包含 Python 脚本和测试用例,演示了:如何将 OpenAI 兼容的消息编码为 DeepSeek-V3.2 期望的单个输入字符串,以及如何将模型的文本输出解析回结构化消息。

import transformers
# encoding/encoding_dsv32.py
from encoding_dsv32 import encode_messages, parse_message_from_completion_text

tokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")

messages = [
    {"role": "user", "content": "hello"},
    {"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."},
    {"role": "user", "content": "1+1=?"}
]
encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)

prompt = encode_messages(messages, **encode_config)
tokens = tokenizer.encode(prompt)

值得注意的是,此版本不包含基于 Jinja 的聊天模板。提供的 Python 实现是权威参考。此外,输出解析函数假设模型输出格式良好,仅用于演示和实验,未经额外错误处理不适用于直接生产使用。

立即试用 8 折 Deepseek V3.2!

为什么需要 developer 角色

在实际的智能体场景中,模型通常需要同时处理三种不同类型的信息:

  • 用户的实际意图或任务目标
  • 模型自身的推理和决策过程
  • 系统或开发者提供的搜索策略、工具约束和执行规则

在早期版本中,这些信号通常混杂在用户提示或系统提示中。随着时间的推移,这导致两个主要问题。首先,模型可能难以区分用户意图与强制行为约束。其次,随着工具链变得更加复杂,工具调用的稳定性和可靠性明显下降。

DeepSeek-V3.2 引入的 developer 角色本质上为搜索代理和工具导向代理提供了一个专用的 控制通道。它被设计用来承载与代理行为严格相关的指令,例如搜索范围、工具使用顺序或策略约束,而不参与普通的对话语义。这种明确的分离使得上下文理解更加清晰,并为更可扩展、更健壮的代理训练奠定了结构基础。

如何在 Claude Code 中访问 DeepSeek V3.2?

Novita AI 目前提供最具性价比的全上下文 Deepseek V3.2 API。

Novita AI 提供 65K 上下文 的 API,成本为 输入 $0.269 / M Token输出 $0.4 / M Token,支持结构化输出和函数调用,为最大化 Deepseek V3.2 的代码代理潜力提供了有力支持。

缓存读取:$0.1345 / M Token 表示在缓存命中时读取缓存 token 的成本。这些 token 之前已被计算并存储,因此无需额外的模型推理。在多个请求共享相同提示前缀、重用对话历史、工具指令或固定规则文本,或者 RAG 检索结果高度重复的系统中,可以实现高缓存命中率,从而显著降低总体推理成本。

立即试用 8 折 Deepseek V3.2!

第一步:获取 API 密钥

步骤 1:登录您的账户,点击“模型库”按钮。

登录并访问模型库

步骤 2:选择模型

浏览可用选项,选择满足您需求的模型。

浏览可用选项,选择满足您需求的模型。

步骤 3:开始免费试用

开始免费试用,探索所选模型的能力。

步骤 4:获取 API 密钥

为了向 API 进行身份验证,我们将为您提供一个新的 API 密钥。进入“设置”页面,您可以按照图中所示复制 API 密钥。

获取 API 密钥

步骤 5:安装 API

使用您的编程语言特定的包管理器安装 API。

安装后,将必要的库导入到您的开发环境中。使用您的 API 密钥初始化 API,以便开始与 Novita AI LLM 交互。以下是适用于 Python 用户的聊天补全 API 示例。

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v3.2",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=65536,
    temperature=0.7
)

print(response.choices[0].message.content)

Claude Code 中使用 DeepSeek V3.2

步骤 1:安装 Claude Code

在安装 Claude Code 之前,请确保您的系统满足最低要求。您的本地环境必须安装 Node.js 18 或更高版本。您可以通过在终端中运行 node --version 来验证您的 Node.js 版本。

对于 Windows

打开命令提示符并执行以下命令:

npm install -g @anthropic-ai/claude-code
npx win-claude-code@latest

全局安装可确保从您系统上的任何目录访问 Claude Code。npx win-claude-code@latest 命令下载并运行最新的特定于 Windows 的版本。

对于 Mac 和 Linux

打开终端并运行:

npm install -g @anthropic-ai/claude-code

Mac 用户可以直接进行全局安装,无需额外的平台特定命令。安装过程会自动配置必要的依赖项和 PATH 变量。

步骤 2:设置环境变量

环境变量将 Claude Code 配置为通过 Novita AI 的 API 端点使用 Deepseek v3.2。这些变量告诉 Claude Code 将请求发送到哪里以及如何进行身份验证。

对于 Windows

打开命令提示符并设置以下环境变量:

set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API Key>
set ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
set ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"

<Novita API Key> 替换为您从 Novita AI 平台获得的实际 API 密钥。这些变量在当前会话期间保持有效,如果关闭命令提示符,必须重新设置。

对于 Mac 和 Linux

打开终端并导出以下环境变量:

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
export ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"

步骤 3:启动 Claude Code

完成安装和配置后,您现在可以在项目目录中启动 Claude Code。使用 cd 命令导航到您想要的项目位置:

cd <your-project-directory>
claude .

点 (.) 参数指示 Claude Code 在当前目录中运行。启动后,您将在交互会话中看到 Claude Code 提示符。

这表明该工具已准备好接收您的指令。该界面为自然语言编程交互提供了一个干净、直观的环境。

步骤 4:在 VSCode 或 Cursor 中使用 Claude Code

Claude Code 与流行的开发环境无缝集成。它增强了您现有的工作流程,而不是取代它。

您可以直接在 VSCode 或 Cursor 的终端中使用 Claude Code。这样可以在利用 AI 辅助的同时,保持对您熟悉的开发工具的访问。

此外,Claude Code 插件也可用于 VSCode 和 Cursor。

如何在 Claude Code 中使用外部模型?

如果您希望在工作流程中动态切换不同的大型语言模型(例如 Anthropic 的 Claude、智谱的 GLM 以及月之暗面的 Kimi),有一些策略可以在不进行大量代码更改的情况下实现。本节将解释如何使用统一 API 和配置切换快速更换模型。

使用环境变量(Claude Code 方法):

如果您正在使用像 Claude Code 或绑定到特定 API 的 SDK 之类的工具,您可以简单地通过调整环境配置来切换模型。Novita AI 提供了多种模型选项,您可以尝试以找到最合适的一个。

Novita AI 提供了多种模型选项,您可以尝试以找到最合适的一个。

立即查看其他模型!

DeepSeek V3.2 引入了 DSA 作为有针对性的架构升级,大幅降低了计算成本,提高了长上下文有效性,并改善了以代码为中心的准确性,同时保持了有竞争力的推理性能。该模型支持对大型仓库和复杂技术文档进行可扩展分析,与 DeepSeek V3.1-Terminus 和专有替代方案相比,在效率和能力之间展现了有利的平衡。这些进步使 DeepSeek V3.2 成为持续开发工作流和长上下文 AI 应用的成本效益解决方案。

常见问题解答

DeepSeek V3.2 中 DeepSeek 稀疏注意力 (DSA) 的主要优势是什么?

DeepSeek V3.2 使用 DSA 选择性地激活注意力连接,在降低二次注意力成本的同时,保持跨长上下文的准确代码理解。

DeepSeek V3.2 在实际编码工作流中与 DeepSeek V3.1-Terminus 有何不同?

与 DeepSeek V3.1-Terminus 相比,DeepSeek V3.2 提供更低的运营成本、128K 上下文窗口和更快的推理稳定性,从而实现更高效的仓库级代码分析。

DeepSeek V3.2 是否改进了长上下文技术文档处理?

是的。DeepSeek V3.2 支持同时分析复杂文档和跨文件关系,在多文档推理任务中优于 DeepSeek V3.1-Terminus。

Novita AI 是一体化云平台,助力您的 AI 梦想。集成 API、无服务器、GPU 实例——您需要的经济高效的工具。消除基础设施障碍,免费开始,让您的 AI 愿景成为现实。

推荐阅读

如何访问 Qwen 3 Coder:Qwen Code;Claude Code;Trae

DeepSeek vs Qwen:识别哪个生态系统适合生产需求

DeepSeek R1 0528 成本:API、GPU、本地部署对比