Novita AI 上线 DeepSeek-V3.1-Terminus:增强型 AI 模型,Agent 能力大幅提升

Novita AI 上线 DeepSeek-V3.1-Terminus:增强型 AI 模型,Agent 能力大幅提升

DeepSeek-V3.1-Terminus 是 DeepSeek-V3.1 的更新版本,在保留原有能力的同时解决了用户反馈的关键问题。该模型在语言一致性方面有所改进,同时增强了代码代理(Code Agent)和搜索代理(Search Agent)的性能。

采用 MIT 许可证发布,支持无限制商业使用,模型结构与 DeepSeek-V3 保持一致。Novita AI 通过可扩展平台提供无缝云部署,方便您使用这款增强型模型。在 Novita AI 上使用 DeepSeek-V3.1-Terminus,无需处理基础设施复杂度即可享受其升级后的能力。

Novita AI 当前定价:131072 上下文长度,输入 $0.27/百万 tokens,输出 $1/百万 tokens

试用 DeepSeek V3.1 Terminus 演示

什么是 DeepSeek-V3.1-Terminus?

DeepSeek-V3.1-Terminus 是一款更新模型,在保留 DeepSeek-V3.1 原有能力的同时,解决了用户反馈的特定问题。它基于 DeepSeek-V3.1-Base 模型打造,是一款专注于实用改进的优化版本。

该模型采用与 DeepSeek-V3 一致的结构,以 MIT 许可证发布,同时支持研究和商业应用的开源访问。

核心改进

语言一致性

本次更新减少了中英混合文本的出现,并消除了此前版本中偶发的异常字符问题。

Agent 能力

DeepSeek-V3.1-Terminus 针对以下场景优化了性能:

  • 代码代理(Code Agent):增强的编程能力和性能
  • 搜索代理(Search Agent):更新了模板和工具集,功能更完善

搜索代理的改进效果可在提供的 assets/search_tool_trajectory.html 文件中查看。

性能基准测试

Benchmark DeepSeek-V3.1 DeepSeek-V3.1-Terminus
Reasoning Mode w/o Tool Use
MMLU-Pro 84.8 85.0
GPQA-Diamond 80.1 80.7
Humanity’s Last Exam 15.9 21.7
LiveCodeBench 74.8 74.9
Codeforces 2091 2046
Aider-Polyglot 76.3 76.1
Agentic Tool Use
BrowseComp 30.0 38.5
BrowseComp-zh 49.2 45.0
SimpleQA 93.4 96.8
SWE Verified 66.0 68.4
SWE-bench Multilingual 54.5 57.8
Terminal-bench 31.3 36.7

基准测试结果显示模型在关键领域有显著提升。尤其值得关注的是:人类最后一场考试(Humanity’s Last Exam)提升 36%,BrowseComp 提升 28%,SimpleQA 提升 3.6%,Terminal-bench 提升 17%。

在 Novita AI 上开始使用 DeepSeek-V3.1-Terminus

通过 Novita AI 使用 DeepSeek-V3.1-Terminus 提供多种接入路径,适配不同技术水平和使用场景。无论您是探索 AI 能力的业务用户,还是开发生产级应用的开发者,Novita AI 都能提供您需要的工具。

使用在线演练场(现已开放,无需编码)

  • 即时访问注册 后即可在数秒内开始体验 DeepSeek-V3.1-Terminus
  • 交互式界面:实时测试提示词并可视化输出结果
  • 模型对比:针对您的具体使用场景,对比 DeepSeek-V3.1-Terminus 与其他主流模型的表现

在线演练场支持您测试各类提示词并立即查看结果,无需任何技术配置。非常适合在全面实施前进行原型验证、想法测试和模型能力评估。

通过 API 集成(已上线,面向开发者)

通过 Novita AI 的统一 REST API 将 DeepSeek-V3.1-Terminus 接入您的应用。

选项 1:直接 API 集成(Python 示例)

from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key="your_api_key_here",
)

model = "deepseek/deepseek-v3.1-terminus"
stream = True # or False
max_tokens = 81920
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = {"type": "text"}

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
        "top_k": top_k,
        "repetition_penalty": repetition_penalty,
        "min_p": min_p
    }
)

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

选项 2:使用 OpenAI Agents SDK 构建多代理工作流

利用 DeepSeek-V3.1-Terminus 的能力构建复杂的多代理系统:

  • 即插即用集成:可在任意 OpenAI Agents 工作流 中使用 DeepSeek-V3.1-Terminus
  • 高级代理能力:支持任务交接、路由和工具集成
  • 可扩展架构:设计可充分利用 DeepSeek-V3.1-Terminus 能力的代理系统

对接第三方平台

开发工具:通过 OpenAI 兼容 API 和 Anthropic 兼容 API,无缝集成 Cursor、Codex、Claude Code、Trae、Qwen Code、Cline 等主流 IDE 和开发环境。

编排框架:通过官方连接器对接 LangChain、Dify、CrewAI、Langflow 及其他 AI 编排平台。

Hugging Face 集成:Novita AI 是 Hugging Face 官方推理服务提供商,确保广泛的生态兼容性。

总结

DeepSeek-V3.1-Terminus 在语言一致性和 Agent 能力方面进行了针对性改进,同时保留了前代模型的坚实基础。增强的代码代理和搜索代理性能,加上更优的语言处理能力,使其成为生产级应用的实用选择。

Novita AI 的云平台无需基础设施投入即可轻松使用这些改进功能。立即在 Novita AI 上使用 DeepSeek-V3.1-Terminus,将这些增强功能应用到您的 AI 应用中。

Novita AI 是一个 AI 云平台,为开发者提供简单的 API 来部署 AI 模型,同时提供高性价比、可靠的 GPU 云服务,用于 AI 模型的构建和扩展。