DeepSeek-V3.1-Terminus 登陸 Novita AI:強化代理能力與效能的新一代 AI 模型

DeepSeek-V3.1-Terminus 登陸 Novita AI:強化代理能力與效能的新一代 AI 模型

DeepSeek-V3.1-Terminus 是 DeepSeek-V3.1 的更新版本,在保留原有功能的同時解決了用戶回報的關鍵問題。該模型在語言一致性、程式碼代理(Code Agent)與搜尋代理(Search Agent)效能上都有提升。採用 MIT 授權,允許無限制商業使用,且模型結構與 DeepSeek-V3 一致。Novita AI 提供無縫的雲端部署服務,您可以透過我們的可擴展平台輕鬆使用這個強化後的模型,无需處理基礎設施的複雜設定即可運用其提升後的能力。

Novita AI 目前定價Novita AI:131072 上下文長度,每百萬輸入 token 0.27 美元,每百萬輸出 token 1 美元

試用 DeepSeek V3.1 Terminus 演示

什麼是 DeepSeek-V3.1-Terminus?

DeepSeek-V3.1-Terminus 是一款更新模型,在保留 DeepSeek-V3.1 原有功能的同時,解決了用戶回報的特定問題。它基於 DeepSeek-V3.1-Base 模型打造,是專注於實用性優化的精煉版本。該模型採用與 DeepSeek-V3 一致的結構,並以 MIT 授權發布,確保研究與商業應用都能自由存取。

主要改進

語言一致性

本次更新減少了中英文混排的情況,並消除了前版本中偶爾出現的異常字元。

代理能力

DeepSeek-V3.1-Terminus 針對以下場景優化了效能:

  • 程式碼代理(Code Agent):強化編碼能力與效能
  • 搜尋代理(Search Agent):更新了模板與工具集,功能更完善

搜尋代理的改進效果可參考提供的 assets/search_tool_trajectory.html 檔案。

效能基準測試

Benchmark DeepSeek-V3.1 DeepSeek-V3.1-Terminus
Reasoning Mode w/o Tool Use
MMLU-Pro 84.8 85.0
GPQA-Diamond 80.1 80.7
Humanity’s Last Exam 15.9 21.7
LiveCodeBench 74.8 74.9
Codeforces 2091 2046
Aider-Polyglot 76.3 76.1
Agentic Tool Use
BrowseComp 30.0 38.5
BrowseComp-zh 49.2 45.0
SimpleQA 93.4 96.8
SWE Verified 66.0 68.4
SWE-bench Multilingual 54.5 57.8
Terminal-bench 31.3 36.7

基準測試結果顯示模型在關鍵領域有顯著提升,尤其值得關注的是:Humanity’s Last Exam 提升 36%、BrowseComp 提升 28%、SimpleQA 提升 3.6%、Terminal-bench 提升 17%。

如何在 Novita AI 上開始使用 DeepSeek-V3.1-Terminus

透過 Novita AI 使用 DeepSeek-V3.1-Terminus 提供多種路徑,適合不同技術程度與使用場景。無論您是探索 AI 能力的商業用戶,還是建構生產應用的開發者,Novita AI 都能提供您需要的工具。

使用線上測試平台(現已開放,无需編碼)

  • 立即存取註冊後即可在幾秒內開始體驗 DeepSeek-V3.1-Terminus
  • 互動介面:即時測試提示詞並可視化輸出結果
  • 模型比較:可針對您的使用場景,比較 DeepSeek-V3.1-Terminus 与其他領先模型的表現

這個線上測試平台无需任何技術設定,即可測試各種提示詞並看到即時結果,非常適合在完整導入前進行原型驗證、想法測試與了解模型能力。

透過 API 整合(已上線,適合開發者使用)

您可以透過 Novita AI 的统一 REST API,將 DeepSeek-V3.1-Terminus 連接至您的應用程式。

選項 1:直接 API 整合(Python 範例)

from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key="your_api_key_here",
)

model = "deepseek/deepseek-v3.1-terminus"
stream = True # or False
max_tokens = 81920
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = {"type": "text"}

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
        "top_k": top_k,
        "repetition_penalty": repetition_penalty,
        "min_p": min_p
    }
)

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

選項 2:使用 OpenAI Agents SDK 構建多代理工作流程

運用 DeepSeek-V3.1-Terminus 的能力構建複雜的多代理系統:

  • 即插即用整合:可在任何 OpenAI Agents 工作流程 中使用 DeepSeek-V3.1-Terminus
  • 進階代理能力:支援代理交接、路由與工具整合
  • 可擴展架構:可設計能運用 DeepSeek-V3.1-Terminus 能力的代理

連接第三方平台

開發工具:透過 OpenAI 相容 API 與 Anthropic 相容 API,無縫整合 Cursor、Codex、Claude Code、Trae、Qwen Code、Cline 等熱門 IDE 與開發環境。

編排框架:使用官方連接器連接 LangChain、Dify、CrewAI、Langflow 等 AI 編排平台。

Hugging Face 整合:Novita AI 是 Hugging Face 的官方推理提供者,確保廣泛的生態系統相容性。

結論

DeepSeek-V3.1-Terminus 在保留前代扎實基礎的同時,針對語言一致性與代理能力進行了針對性優化。強化後的程式碼代理與搜尋代理效能,搭配更好的語言處理能力,使其成為生產應用的實用選擇。Novita AI 的雲端平台讓您无需負擔基礎設施成本,即可輕鬆使用這些改進功能。立即在 Novita AI 上使用 DeepSeek-V3.1-Terminus,將這些強化功能應用於您的 AI 應用程式中。

Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 來部署 AI 模型,同時也提供實惠且可靠的 GPU 雲端服務,用於構建與擴展 AI 應用。