在 Claude Code 中使用 DeepSeek V3.2 解决长上下文编码瓶颈

DeepSeek V3.2 有哪些新的编码功能？
DeepSeek V3.2：为更好地与开发者协作做了哪些改进？
如何在 Claude Code 中访问 DeepSeek V3.2？
如何在 Claude Code 中使用外部模型？

在管理大型代码库或多文档工作流时，开发者经常面临一系列挑战，包括在使用传统 Transformer 模型时遇到的高计算成本、不稳定的长上下文性能以及不一致的代码理解。这些限制制约了迭代效率，限制了仓库级别的分析能力，并增加了运营开销。DeepSeek V3.2 的引入通过集成 DeepSeek 稀疏注意力（DSA） 解决了这些痛点，该机制旨在降低注意力开销、加速上下文推理并稳定代码生成。

本文探讨了 DeepSeek V3.2 如何提升成本效率、长上下文处理能力以及以代码为中心的能力。文章还提供了通过 Novita AI 和 Claude Code 部署 DeepSeek V3.2 的操作指南。

请注意！Novita AI 正在推出“构建月”活动，为开发者提供最高 20% 的独家优惠，适用于所有主要产品！

立即参与构建月活动！

DeepSeek V3.2 有哪些新的编码功能？

DSA 是一种革命性的注意力机制，从根本上改变了模型处理信息的方式。传统 Transformer 要求每个 token 关注所有其他 token，导致二次方计算成本（O(n²)），而 DSA 引入了一种细粒度、内容感知的选择机制：

智能过滤：在训练过程中，模型学习识别哪些 token 关系对特定任务真正重要
动态连接：根据输入内容实时选择必要的注意力连接
任务优化：在处理代码与处理法律文档时，关注不同的结构模式

DSA 实现的三大核心改进

采用直接自适应作为辅助机制，在不改变核心架构的前提下提升整体模型性能。通过这种方法，模型在实现更经济的推理、大幅提升成本效率的同时，保持了与 v3.1 相当的代码生成和分析质量，从而支持频繁测试和快速迭代。

DSA 还增强了对长上下文的利用能力，有效支持高达 128K token 的上下文窗口，从而改进了多文件同步分析、跨文件依赖关系理解以及复杂技术文档的处理。

此外，DSA 有助于提升与代码相关的能力，包括更快的推理响应、更准确的代码理解以及更稳定的代码生成质量，共同增强了模型在大型软件开发场景中的可靠性和效率。

可扩展的强化学习框架

通过采用稳健的强化学习协议并扩展训练后计算量，DeepSeek-V3.2 实现了与 GPT-5 相当的性能。值得注意的是，高计算变体 DeepSeek-V3.2-Speciale 持续优于 GPT-5，并展现出与 Gemini-3.0-Pro 相当的推理能力。

基准	指标	DeepSeek-V3.2-Speciale	DeepSeek-V3.2-Thinking	GPT-5-High	Claude-4.5-Sonnet	Gemini-3.0-Pro
AIME 2025	Pass@1 (%)	96.0	93.1	94.6	87.0	95.0
HMMT 2025	Pass@1 (%)	99.2	90.2	88.3	79.2	97.5
HLE	Pass@1 (%)	30.6	25.1	26.3	13.7	37.7
Codeforces	Rating	2701	2386	2537	1480	2708
SWE Verified	Resolved (%)	–	73.1	74.9	77.2	76.2
Terminal Bench 2.0	Accuracy (%)	–	46.4	35.2	42.8	54.2
τ² Bench	Pass@1 (%)	–	80.3	80.2	84.7	85.4
Tool Decathlon	Pass@1 (%)	–	35.2	29.0	38.6	36.4

立即体验 Deepseek V3.2，享 20% 优惠！

DeepSeek V3.2：为更好地与开发者协作做了哪些改进？

为了更好地将推理能力融入工具使用场景，DeepSeek 在 V3.2 的训练后阶段引入了一个 大规模智能任务合成流水线。核心思想是系统性地大规模生成智能体训练数据，而非依赖手工编写的提示或有限的人工演示。

该流水线以编程方式构建任务，要求模型进行推理、决策、调用工具、观察中间结果并相应调整其行为。通过让模型接触多样化的结构化交互，DeepSeek 实现了可扩展的智能体训练后优化，显著提高了在复杂多步交互环境（如搜索、编码和工具增强工作流）中的行为合规性和泛化能力。

两个最重要的更新是：

修订后的工具调用格式，在多步交互中更加明确和稳定

原生支持 “带工具的思考”，其中推理和工具使用在结构上整合，而非松散交错

为了帮助社区理解和采用这一新模板，DeepSeek 提供了一个专门的 encoding 文件夹。该文件夹包含 Python 脚本和测试用例，演示了：如何将 OpenAI 兼容的消息编码为 DeepSeek-V3.2 所需的单个输入字符串，以及如何将模型的文本输出解析回结构化消息。

import transformers
# encoding/encoding_dsv32.py
from encoding_dsv32 import encode_messages, parse_message_from_completion_text

tokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")

messages = [
    {"role": "user", "content": "hello"},
    {"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."},
    {"role": "user", "content": "1+1=?"}
]
encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)

prompt = encode_messages(messages, **encode_config)
tokens = tokenizer.encode(prompt)

值得注意的是，本次发布不包含基于 Jinja 的聊天模板。提供的 Python 实现是权威参考。此外，输出解析函数假定模型输出格式良好，仅供演示和实验使用，未经额外错误处理不应用于生产环境。

立即体验 Deepseek V3.2，享 20% 优惠！

为什么需要开发者角色

在实际的智能体场景中，模型通常需要同时处理三种不同类型的信息：

用户的真实意图或任务目标
模型自身的推理和决策过程
系统或开发者提供的搜索策略、工具约束和执行规则

在早期版本中，这些信号通常混杂在用户提示或系统提示中。随着时间的推移，这导致了两个主要问题。首先，模型可能难以区分用户意图和强制性行为约束。其次，随着工具链变得更加复杂，工具调用的稳定性和可靠性明显下降。

DeepSeek-V3.2 中引入的 developer 角色本质上充当了搜索智能体和工具导向智能体的专用 控制通道。它旨在承载与智能体行为严格相关的指令，例如搜索范围、工具使用顺序或策略约束，而不参与普通对话语义。这种明确的分离实现了更清晰的上下文理解，并为更可扩展、更稳健的智能体训练奠定了结构基础。

如何在 Claude Code 中访问 DeepSeek V3.2？

Novita AI 目前提供最具性价比的全上下文 Deepseek V3.2 API。

Novita AI 提供 65K 上下文 ** 的 API，成本为 ** 输入 $0.269/百万 token 和 ** 输出 $0.4/百万 token*，支持结构化输出和函数调用，为最大化 Deepseek V3.2 的代码智能体潜力提供了强大支持。*

缓存读取：$0.1345 / 百万 token 表示缓存命中时读取缓存 token 的成本。这些 token 之前已被计算和存储，因此无需额外的模型推理。在多个请求共享相同提示前缀、重复使用对话历史、工具指令或固定规则文本，或 RAG 检索结果高度重复的系统中，可以实现高缓存命中率，从而显著降低整体推理成本。

立即体验 Deepseek V3.2，享 20% 优惠！

第一步：获取 API 密钥

步骤 1：登录您的账户，点击“模型库”按钮。

步骤 2：选择您的模型

浏览可用的选项，选择适合您需求的模型。

步骤 3：开始免费试用

开始免费试用，探索所选模型的功能。

步骤 4：获取您的 API 密钥

为了进行 API 身份验证，我们将为您提供一个新的 API 密钥。进入“设置”页面，您可以按照图片所示复制 API 密钥。

步骤 5：安装 API

使用特定于您编程语言的包管理器安装 API。

安装后，将必要的库导入到您的开发环境中。使用您的 API 密钥初始化 API，开始与 Novita AI LLM 进行交互。以下是针对 Python 用户的聊天补全 API 示例。

from openai import OpenAI

client = OpenAI(
    api_key="<您的 API 密钥>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v3.2",
    messages=[
        {"role": "system", "content": "您是一个有用的助手。"},
        {"role": "user", "content": "你好，最近怎么样？"}
    ],
    max_tokens=65536,
    temperature=0.7
)

print(response.choices[0].message.content)

在 Claude Code 中使用 DeepSeek V3.2

步骤 1：安装 Claude Code

在安装 Claude Code 之前，请确保您的系统满足最低要求。您的本地环境必须安装 Node.js 18 或更高版本。您可以在终端中运行 node --version 来验证您的 Node.js 版本。

Windows 系统

打开命令提示符，执行以下命令：

npm install -g @anthropic-ai/claude-code
npx win-claude-code@latest

全局安装可确保 Claude Code 从系统的任何目录均可访问。npx win-claude-code@latest 命令会下载并运行最新的 Windows 特定版本。

Mac 和 Linux 系统

打开终端，运行：

npm install -g @anthropic-ai/claude-code

Mac 用户可以直接进行全局安装，无需额外的平台特定命令。安装过程会自动配置必要的依赖项和 PATH 变量。

步骤 2：设置环境变量

环境变量配置 Claude Code 通过 Novita AI 的 API 端点使用 Deepseek v3.2。这些变量告诉 Claude Code 将请求发送到哪里以及如何进行身份验证。

Windows 系统

打开命令提示符，设置以下环境变量：

set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API 密钥>
set ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
set ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"

将 <Novita API 密钥> 替换为您从 Novita AI 平台获取的实际 API 密钥。这些变量在当前会话期间保持有效，如果关闭命令提示符，则需要重新设置。

Mac 和 Linux 系统

打开终端，导出以下环境变量：

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API 密钥>"
export ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"

步骤 3：启动 Claude Code

安装和配置完成后，您现在可以在项目目录中启动 Claude Code。使用 cd 命令导航到您想要的项目位置：

cd <您的项目目录>
claude .

点（.）参数指示 Claude Code 在当前目录中操作。启动后，您将看到 Claude Code 提示符出现在交互式会话中。

这表明该工具已准备好接收您的指令。该界面提供了一个干净、直观的自然语言编程交互环境。

步骤 4：在 VSCode 或 Cursor 中使用 Claude Code

Claude Code 与流行的开发环境无缝集成。它增强了您现有的工作流程，而非取而代之。

您可以在 VSCode 或 Cursor 的终端中直接使用 Claude Code。这使您在利用 AI 助力的同时，仍可使用熟悉的开发工具。

此外，Claude Code 插件可用于 VSCode 和 Cursor。

如何在 Claude Code 中使用外部模型？

如果您希望在工作流程中动态切换不同的大语言模型（例如 Anthropic 的 Claude、智谱的 GLM 和月之暗面的 Kimi），有一些策略可以在不进行大量代码更改的情况下实现。本节解释了如何使用统一 API 和配置开关快速切换模型。

使用环境变量（Claude Code 方法）：

如果您正在使用 Claude Code 或绑定到特定 API 的 SDK 等工具，您可以仅通过调整环境配置来切换模型。Novita AI 提供多种模型选项，您可以进行实验以找到最合适的模型。

立即查看其他模型！

DeepSeek V3.2 引入了 DSA 作为一项针对性的架构升级，在保持竞争性推理性能的同时，大幅降低了计算成本，提高了长上下文有效性，并提升了以代码为中心的准确性。该模型能够对大型代码库和复杂技术文档进行可扩展的分析，与 DeepSeek V3.1-Terminus 和专有替代方案相比，在效率和能力之间展现出良好的平衡。这些进步使 DeepSeek V3.2 成为持续开发工作流和长上下文 AI 应用中经济高效的解决方案。

常见问题解答

DeepSeek V3.2 中的 DeepSeek 稀疏注意力（DSA）的主要优势是什么？

DeepSeek V3.2 使用 DSA 选择性激活注意力连接，降低了二次注意力成本，同时保持了在长上下文中的准确代码理解。

DeepSeek V3.2 在实际编码工作流中与 DeepSeek V3.1-Terminus 有何不同？

与 DeepSeek V3.1-Terminus 相比，DeepSeek V3.2 提供了更低的运营成本、128K 上下文窗口和更快的推理稳定性，从而实现更高效的仓库级代码分析。

DeepSeek V3.2 是否改进了长上下文技术文档的处理？

是的。DeepSeek V3.2 支持同时分析复杂文档和跨文件关系，在多文档推理任务中优于 DeepSeek V3.1-Terminus。

Novita AI 是一个一站式云平台，助力您的 AI 雄心。集成 API、无服务器、GPU 实例——您所需的成本效益工具。免去基础设施烦恼，免费开始，让您的 AI 愿景成为现实。

如何访问 Qwen 3 Coder：Qwen Code、Claude Code、Trae

DeepSeek vs Qwen：识别哪个生态系统适合生产需求

在 Claude Code 中使用 DeepSeek V3.2 解决长上下文编码瓶颈

DeepSeek V3.2 有哪些新的编码功能？

DSA 实现的三大核心改进

可扩展的强化学习框架

DeepSeek V3.2：为更好地与开发者协作做了哪些改进？

为什么需要开发者角色

如何在 Claude Code 中访问 DeepSeek V3.2？

第一步：获取 API 密钥

在 Claude Code 中使用 DeepSeek V3.2

步骤 1：安装 Claude Code

步骤 2：设置环境变量

步骤 3：启动 Claude Code

步骤 4：在 VSCode 或 Cursor 中使用 Claude Code

如何在 Claude Code 中使用外部模型？

Product

RESOURCES

Partners

Company

DeepSeek V3.2 有哪些新的编码功能？

DSA 实现的三大核心改进

可扩展的强化学习框架

DeepSeek V3.2：为更好地与开发者协作做了哪些改进？

为什么需要开发者角色

如何在 Claude Code 中访问 DeepSeek V3.2？

第一步：获取 API 密钥

在 Claude Code 中使用 DeepSeek V3.2

步骤 1：安装 Claude Code

步骤 2：设置环境变量

步骤 3：启动 Claude Code

步骤 4：在 VSCode 或 Cursor 中使用 Claude Code

如何在 Claude Code 中使用外部模型？

相关文章

Product

RESOURCES

Partners

Company