DeepSeek V3 & R1 升級版:160K Token 上下文與輸出,價格更低

DeepSeek V3 & R1 升級版:160K Token 上下文與輸出,價格更低

在 Novita AI,我們興奮地宣布 DeepSeek 模型已升級,支援 160k 的內容長度,相較於先前的 128k 限制有顯著提升。這項升級代表您現在可以一次性處理和分析更大的資料集,節省時間並提高效率。限時優惠,新用戶可領取 10 美元免費額度,在 Novita AI 上探索升級後的 DeepSeek 模型及各種其他 LLM API。

DeepSeek-R1-0528

簡介

DeepSeek R1 05282025 年 5 月 28 日 ** 推出,是一款 開源大型模型 **,約有 **6850 億參數 。它採用 ** 混合專家(MoE) 架構,推論時每個 token 約啟動 **370 億參數 **。該模型支援最大 128K token 的上下文長度。

此模型在 聊天、** 推理 程式碼 數學 ** 和** 函式呼叫 ** 方面表現優異,並新增支援 JSON 輸出 ** 和 函式呼叫介面 ,大幅提升處理 複雜任務 的能力。模型訓練資料超過 10 兆 token,包括 ** 網路內容、** 程式碼 數學資料 ** 和** 文件 ,特別著重於 英文 ** 和** 中文 ** 的** 雙語能力**。

訓練過程使用了傳統的 人類回饋強化學習(RLHF) 和 ** 微調方法**,並結合大量 ** 運算資源與後期階段 ** 演算法最佳化。這種方法優先考慮 ** 準確性** 和 ** 可靠性** 而非效率,使模型非常適合 ** 企業應用**,尤其是需要 ** 複雜推理** 和 ** 高精度** 的場景。

基準測試

DeepSeek R1 0528 基準比較

DeepSeek-V3-0324

簡介

DeepSeek V3 0324 於 2025 年 3 月 25 日推出,是一款開源大型模型,約有 6710 億參數,推論時每個 token 約啟動 370 億參數。它採用 混合專家(MoE) 架構,支援最大 160K token 的上下文長度,能夠處理超長輸入並產生擴展輸出。

該模型專精於 多重對話、** 深度推理 程式碼生成 ** 和** 數學問題解決 ** 等任務。增強的** 中文 ** 等多語言支援,以及其** 文字轉文字多模態能力 **,進一步擴展了其多功能性。訓練資料包含 14.8 兆 token 的多樣化來源,包括網路內容、程式碼庫和技術文件,確保了複雜應用所需的強大知識基礎。

DeepSeek V3 0324 採用先進的 預訓練技術 和針對特定用例的 ** 訓練後微調**。這種全面方法,加上大量的運算資源,優先考慮準確性、連貫性和可靠性,使模型非常適合需要 ** 長篇內容生成**、** 複雜問題解決 ** 和** 企業級效能** 的行業。

基準測試

DeepSeek V3 0324 基準比較

內容長度

什麼是內容長度?

在 DeepSeek 等 AI 模型中,內容長度 指的是模型在單次互動中可以處理和生成的最大 token(單詞、標點或符號)數量。它定義了模型一次能理解的輸入量以及能產生的輸出量。更大的上下文窗口讓 AI 模型能夠處理更長的輸入,並在每次輸出中納入更多資訊。

內容長度如何影響效能?

內容長度顯著影響模型以下能力:

  • 理解上下文: 更長的上下文窗口允許模型參考更多輸入資訊,減少遺漏關鍵細節的機會。
  • 生成連貫輸出: 透過存取完整上下文,模型可以產生邏輯一致的長篇輸出。
  • 實現複雜推理: 需要多步驟推理或追蹤歷史狀態的任務,如程式碼編寫、技術分析或深度研究,都因擴展上下文而受益匪淺。

160K Token 擴展的優勢

藉由最近的升級,DeepSeek-V3-0324DeepSeek-R1-0528 現在支援 160k token 限制,相較於先前的 128k 上下文窗口有顯著提升。此次擴展帶來幾個關鍵優勢:

  1. 支援超長對話: 擴展的上下文窗口允許無縫的多輪對話,不會遺失先前的互動,非常適合需要長期一致性和記憶的任務。
  2. 促進深度代理分析: 代理現在可以在更長的時間內分析更大的資料集或進行更深入的推理,為商業智慧或科學研究等應用開闢新可能。
  3. 啟用長輸出應用: 像 ** 程式碼生成**、** 文件摘要 ** 或** 詳細報告生成** 等任務現在可以處理更大、更複雜的輸入,在單次輸出中提供全面結果。

透過擴展內容長度,DeepSeek 現在更能滿足現代工作流程的需求,成為不同行業用戶的強大工具。

透過 Novita AI 存取 DeepSeek

步驟 1:登入並存取模型庫

登入您的帳戶,然後點擊 模型庫 按鈕。

登入並存取模型庫

步驟 2:選擇模型

瀏覽可用選項,選擇適合您需求的模型。

選擇模型

步驟 3:開始免費試用

開始免費試用,探索所選模型的功能。

開始 DeepSeek R1 0528 的免費試用

立即試用 DeepSeek

步驟 4:取得您的 API 金鑰

為了驗證 API,我們將提供一個新的 API 金鑰。進入「設定」頁面,您可以依圖示複製 API 金鑰。

取得 API 金鑰

步驟 5:安裝 API

使用您程式語言專屬的套件管理器安裝 API。

安裝 API

安裝完成後,將必要程式庫匯入您的開發環境。使用您的 API 金鑰初始化 API,開始與 Novita AI LLM 互動。以下是使用 Python 的聊天完成 API 存取 DeepSeek R1 0528 的範例。

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="session_r5eB9eC3oBfDyuGn69eevTLAudts6AFa3JeHeml91oVyVe6uZnGUmAh7aO9rZxUSRocPWUBszQaiC39g4VGiAg==",
)

model = "deepseek/deepseek-r1-0528"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

Novita AI 同時提供 DeepSeek R1 0528 和 DeepSeek V3 0324,並支援擴展的上下文長度,讓您能夠處理更長的對話和更複雜的專案。DeepSeek R1 0528 每百萬輸入/輸出 token 僅需 $0.7/$2.5,而 DeepSeek V3 0324 更為實惠,每百萬 token 僅 $0.28/$1.14,讓您無需超出預算即可獲得尖端 AI 效能。限時優惠,新用戶可領取 10 美元免費額度,在 Novita AI 上探索升級後的 DeepSeek 模型及各種其他 LLM API。

常見問題

什麼是 Deepseek V3 0324?

Deepseek V3 0324 是 DeepSeek 推出的最新一代大型語言模型,專為一般對話、理解和進階推理而設計。

擴展的上下文長度對程式設計專案有何好處?

有了擴展上下文,您可以分享整個程式碼庫、在多重檔案間維持上下文,並處理複雜的重構任務,而不會遺失不同部分之間的依賴關係。這顯著提升了 AI 提供準確、上下文相關建議的能力。

LLM 的理想上下文長度是多少?

對於大多數應用,32K-128K token 已能提供優異效能,而 Novita AI 升級後的 160K 上下文長度確保您可以不受限制地處理最複雜的文件和長時間對話。

關於 Novita AI

Novita AI 是一個 AI 雲端平台,為開發者提供透過簡單 API 部署 AI 模型的簡便方式,同時提供價格實惠且可靠的 GPU 雲端資源,用於建置和擴展。