免費使用 DeepSeek R1 的四種方法

免費使用 DeepSeek R1 的四種方法

重點摘要

** 進階效能 **:在數學與程式基準測試中表現優異。

** 開放原始碼 **:可用於研究、修改與部署。

** 成本效益 **:提供與 OpenAI o1 相當的效能,但成本僅為其一小部分。

** 4 種免費方式 **:線上平台、本地端、API、AI 遊樂場

DeepSeek R1 是先進的推理模型,旨在與 OpenAI 的 o1 相抗衡,在邏輯推理、數學與程式設計等複雜任務中表現出色。其開放原始碼特性與專注於進階推理能力,使其成為開發者與企業極具價值的工具。然而,R1 的定價較 DeepSeek V3 更高。為了幫助您入門,以下提供四種免費探索與使用 DeepSeek R1 的方法。

DeepSeek R1 概覽

DeepSeek-R1 旨在處理需要邏輯推理、進階數學與程式設計的任務。它基於 DeepSeek-R1-Zero,結合強化學習與監督式微調,以提升輸出清晰度與連貫性。DeepSeek-R1 在數學、程式碼與推理任務上達到與 OpenAI-o1 相當的效能。

立即取得 $20 點數,開始免費試用 DeepSeek R1!

主要特色

  • 模型大小:671B 參數(37B 活躍/標記)
  • 分詞器:增強型分詞器,具備自我反思標籤
  • 支援語言:多語言,具備文化適應能力
  • 多模態:僅限文字
  • 上下文視窗:128K 標記
  • 儲存格式:支援 Q8/Q5 量化
  • 架構:混合專家(MoE)+ 強化學習增強訓練管線
  • 訓練方法:基於 V3 基礎,搭配 RL 管線(SFT → RL → SFT → RL)
  • 訓練資料:V3 基礎 + RL 最佳化資料

效能基準

DeepSeek-R1 在數學方面表現出色,在 MATH-500 上取得 97.3% 的最高分數,在 AIME 2024 上取得 79.8% 的分數,超越競爭對手。在程式碼方面,它在 SWE-bench Verified 上以 49.2% 的成績與 Live Code Bench 上以 65.9% 的成績脫穎而出,展現了在兩個領域的全面專業能力。

DeepSeek R1 基準測試

所有模型均以最大生成長度 32,768 個標記進行評估,使用特定的取樣參數(溫度 0.6,top-p 0.95,每個查詢 64 個回應)來計算 pass@1 基準。

DeepSeek-R1-Distill 模型

蒸餾(或知識蒸餾)是一種機器學習方法,將知識從較大的模型轉移到較小的模型。目標是開發一個更高效的模型,能夠達到與較大模型相似的效能。

DeepSeek 也發布了 R1 的蒸餾版本,提供更小的模型,這些模型保留了原始模型的大部分能力,同時在計算上更有效率。這些模型使用 DeepSeek-R1 生成的資料進行微調,提供從 1.5 billion 到 70 billion 參數的尺寸。

DeepSeek-R1-Distill 模型基準

來源:DeepSeek 發布論文

1.使用線上平台 存取 DeepSeek R1(例如 Novita AI)

您可以透過 Novita AI 平台存取 DeepSeek-R1,該平台提供與模型互動的簡便方式。若要開始,只需前往聊天頁面並註冊即可。但是請注意,線上平台不支援儲存先前會話的聊天記錄。

此外,Novita AI 提供參數調整面板,讓您可以自訂設定,例如 max tokenstemperature 等,以符合您的特定使用情境。

立即在 Novita AI 取得 $20 點數!

2.在本地端執行 DeepSeek R1

1. 安裝 Ollama

  • 前往 Ollama 網站,下載並安裝適合您作業系統的版本。

2. 下載 DeepSeek-R1 模型

  • 開啟終端機並執行(以 7B 參數版本為例):bashCopyollama run deepseek-r1:7b(等待下載完成;時間取決於網路速度。)
ollama run deepseek-r1:7b

3. 驗證與執行

  • 驗證安裝
ollama list  # 檢查清單中是否有 "deepseek-r1"
  • 啟動模型
ollama run deepseek-r1:7b

4. 使用範例

  • 提出查詢:bashCopy>>> "用量子運算的簡單術語說明。"
  • 產生程式碼:bashCopy>>> "撰寫一個 Python 函式來計算費波那契數列。"

3.存取免費的 DeepSeek R1 API(例如 Novita AI)

Novita AI 是一個 AI 雲端平台,為開發者提供使用簡單 API 部署 AI 模型的簡便方式,同時也提供價格合理且可靠的 GPU 雲端用於建置與擴展。

第 1 步:登入並存取模型庫

登入您的帳戶,然後點選 Model Library 按鈕。

登入並存取模型庫

第 2 步:選擇您的模型

瀏覽可用的選項,並選擇符合您需求的模型。

選擇模型

第 3 步:開始免費試用

開始您的免費試用,探索所選模型的功能。

在 R1 上開始免費試用

第 4 步:取得您的 API 金鑰

為了進行 API 驗證,我們將提供您一個新的 API 金鑰。進入 Settings 頁面,您可以依照圖片指示複製 API 金鑰。

取得 API 金鑰

第 5 步:安裝 API

使用您程式語言專用的套件管理器安裝 API。

安裝 API

安裝後,將必要的程式庫匯入您的開發環境。使用您的 API 金鑰初始化 API,開始與 Novita AI LLM 互動。以下是適用於 Python 使用者的聊天補全 API 範例。

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=&#91;
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices&#91;0].delta.content or "", end="")
else:
    print(chat_completion_res.choices&#91;0].message.content)
  
  

4.在 Hugging Face 上體驗 DeepSeek R1

第 1 步:設定 API 金鑰

  • 前往您的使用者帳戶設定,管理您的 API 金鑰。
  • 將您的 Novita AI 自訂 API 金鑰新增至 Hugging Face。

在 Hugging Face 設定 API 金鑰

第 2 步:選擇推理 API 模式

  • 自訂金鑰模式:呼叫直接發送至推理提供者,使用您自己的 API 金鑰。
  • HF-Routed 模式:在此模式下,不需要提供者令牌。費用會計入您的 Hugging Face 帳戶,而非提供者的帳戶。

選擇推理 API 模式

第 3 步:在模型頁面上探索相容的提供者

  • 模型頁面會顯示與所選模型相容的第三方推理提供者(與當前模型相容的提供者,依使用者偏好排序)。

在 Hugging Face 的模型頁面上探索相容的提供者

在 AI 遊樂場中進行實驗是探索 Llama 3 模型功能的絕佳方式,無需進階技術技能或設定。無論您是使用 HuggingChat 進行創意專案、使用 Meta AI Web 無縫整合到日常應用,還是使用 Perplexity Labs 進行擴展實驗,這些平台都能讓尖端 AI 對所有層級的使用者變得易於使用且實用。

常見問題

DeepSeek R1 比 OpenAI 的 o1 更好嗎?

DeepSeek R1 提供相當的效能,特別是在推理任務上,而且開放原始碼且更具成本效益。

哪些任務最適合 DeepSeek R1?

需要高推理強度的任務,例如數學解題、程式設計以及特定產業的應用。

DeepSeek-R1 可以針對特定任務或產業進行微調嗎?

可以,DeepSeek-R1 可以針對特定任務進行微調,只要您具備必要的運算資源與資料。

Novita AI 是一站式雲端平台,助力您的 AI 野心。整合 API、無伺服器、GPU 實例 — 您需要的經濟高效工具。無需基礎設施,免費開始,讓您的 AI 願景成真。

推薦閱讀