DeepSeek-V3.1-Terminus 是 DeepSeek-V3.1 的更新版本,在保留原有能力的同时解决了用户反馈的关键问题。该模型在语言一致性方面有所改进,同时增强了代码代理(Code Agent)和搜索代理(Search Agent)的性能。
采用 MIT 许可证发布,支持无限制商业使用,模型结构与 DeepSeek-V3 保持一致。Novita AI 通过可扩展平台提供无缝云部署,方便您使用这款增强型模型。在 Novita AI 上使用 DeepSeek-V3.1-Terminus,无需处理基础设施复杂度即可享受其升级后的能力。
Novita AI 当前定价:131072 上下文长度,输入 $0.27/百万 tokens,输出 $1/百万 tokens
什么是 DeepSeek-V3.1-Terminus?
DeepSeek-V3.1-Terminus 是一款更新模型,在保留 DeepSeek-V3.1 原有能力的同时,解决了用户反馈的特定问题。它基于 DeepSeek-V3.1-Base 模型打造,是一款专注于实用改进的优化版本。
该模型采用与 DeepSeek-V3 一致的结构,以 MIT 许可证发布,同时支持研究和商业应用的开源访问。
核心改进
语言一致性
本次更新减少了中英混合文本的出现,并消除了此前版本中偶发的异常字符问题。
Agent 能力
DeepSeek-V3.1-Terminus 针对以下场景优化了性能:
- 代码代理(Code Agent):增强的编程能力和性能
- 搜索代理(Search Agent):更新了模板和工具集,功能更完善
搜索代理的改进效果可在提供的 assets/search_tool_trajectory.html 文件中查看。
性能基准测试
| Benchmark | DeepSeek-V3.1 | DeepSeek-V3.1-Terminus |
|---|---|---|
| Reasoning Mode w/o Tool Use | ||
| MMLU-Pro | 84.8 | 85.0 |
| GPQA-Diamond | 80.1 | 80.7 |
| Humanity’s Last Exam | 15.9 | 21.7 |
| LiveCodeBench | 74.8 | 74.9 |
| Codeforces | 2091 | 2046 |
| Aider-Polyglot | 76.3 | 76.1 |
| Agentic Tool Use | ||
| BrowseComp | 30.0 | 38.5 |
| BrowseComp-zh | 49.2 | 45.0 |
| SimpleQA | 93.4 | 96.8 |
| SWE Verified | 66.0 | 68.4 |
| SWE-bench Multilingual | 54.5 | 57.8 |
| Terminal-bench | 31.3 | 36.7 |
基准测试结果显示模型在关键领域有显著提升。尤其值得关注的是:人类最后一场考试(Humanity’s Last Exam)提升 36%,BrowseComp 提升 28%,SimpleQA 提升 3.6%,Terminal-bench 提升 17%。
在 Novita AI 上开始使用 DeepSeek-V3.1-Terminus
通过 Novita AI 使用 DeepSeek-V3.1-Terminus 提供多种接入路径,适配不同技术水平和使用场景。无论您是探索 AI 能力的业务用户,还是开发生产级应用的开发者,Novita AI 都能提供您需要的工具。
使用在线演练场(现已开放,无需编码)
- 即时访问:注册 后即可在数秒内开始体验 DeepSeek-V3.1-Terminus
- 交互式界面:实时测试提示词并可视化输出结果
- 模型对比:针对您的具体使用场景,对比 DeepSeek-V3.1-Terminus 与其他主流模型的表现
在线演练场支持您测试各类提示词并立即查看结果,无需任何技术配置。非常适合在全面实施前进行原型验证、想法测试和模型能力评估。
通过 API 集成(已上线,面向开发者)
通过 Novita AI 的统一 REST API 将 DeepSeek-V3.1-Terminus 接入您的应用。
选项 1:直接 API 集成(Python 示例)
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key="your_api_key_here",
)
model = "deepseek/deepseek-v3.1-terminus"
stream = True # or False
max_tokens = 81920
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = {"type": "text"}
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
选项 2:使用 OpenAI Agents SDK 构建多代理工作流
利用 DeepSeek-V3.1-Terminus 的能力构建复杂的多代理系统:
- 即插即用集成:可在任意 OpenAI Agents 工作流 中使用 DeepSeek-V3.1-Terminus
- 高级代理能力:支持任务交接、路由和工具集成
- 可扩展架构:设计可充分利用 DeepSeek-V3.1-Terminus 能力的代理系统
对接第三方平台
开发工具:通过 OpenAI 兼容 API 和 Anthropic 兼容 API,无缝集成 Cursor、Codex、Claude Code、Trae、Qwen Code、Cline 等主流 IDE 和开发环境。
编排框架:通过官方连接器对接 LangChain、Dify、CrewAI、Langflow 及其他 AI 编排平台。
Hugging Face 集成:Novita AI 是 Hugging Face 官方推理服务提供商,确保广泛的生态兼容性。
总结
DeepSeek-V3.1-Terminus 在语言一致性和 Agent 能力方面进行了针对性改进,同时保留了前代模型的坚实基础。增强的代码代理和搜索代理性能,加上更优的语言处理能力,使其成为生产级应用的实用选择。
Novita AI 的云平台无需基础设施投入即可轻松使用这些改进功能。立即在 Novita AI 上使用 DeepSeek-V3.1-Terminus,将这些增强功能应用到您的 AI 应用中。
Novita AI 是一个 AI 云平台,为开发者提供简单的 API 来部署 AI 模型,同时提供高性价比、可靠的 GPU 云服务,用于 AI 模型的构建和扩展。
