2025 完整指南:如何在 Novita AI 部署自訂模型並在 Cursor 中使用

2025 完整指南:如何在 Novita AI 部署自訂模型並在 Cursor 中使用

想要完全掌控為你的程式碼助手提供動力的 AI 模型嗎?這份完整指南將教你如何在 Novita AI 的 GPU 基礎設施上部署自訂模型,並無縫整合到 Cursor IDE 中。與使用預設配置的 API 端點不同,部署自己的實例能讓你完全掌控模型選擇、配置與效能優化。

實務範例:DeepSeek-R1-Distill-Qwen-1.5B

步驟 1:確認模型的基礎架構

造訪 https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B。複製模型名稱供後續使用。

步驟 2:找到對應的解析器

查閱 vLLM 工具呼叫 說明文件。針對 Qwen-2.5 系列模型,請使用 hermes 解析器。

為什麼工具呼叫對編碼代理至關重要

Cursor 不只是發送提示詞並接收文字回應,它需要能與你的開發環境互動、理解多檔案上下文、執行特定操作的模型。工具呼叫就是實現這些能力的橋梁。

不同模型系列需要不同的解析器。請查閱 vLLM 工具呼叫說明文件,為你的模型匹配正確的解析器類型。

步驟 3:建立 Novita AI 帳號

  • 造訪 Novita AI 平台
  • 點擊 註冊 即可立即使用
  • 註冊完成後自動獲得 1 美元免費額度

步驟 4:範本選擇

從模型庫中選擇 DeepSeek-R1-Distill-Qwen-1.5B,或建立你自己的範本。

選擇 4090 顯卡

步驟 5:參數確認

檢視配置畫面上顯示的部署參數,確認所有設定無誤後點擊 下一步 繼續。

容器啟動參數 欄位中,新增:

--enable-auto-tool-choice --tool-call-parser hermes

重要:解析器必須與你的模型系列匹配。請查閱 vLLM 說明文件取得正確的解析器。

使用範本

步驟 6:實例部署

點擊 部署 開始建立實例,系統將開始配置你的 GPU 實例。

部署範本

步驟 7:監控部署進度

前往 實例管理 開啟控制台,這個儀表板能讓你即時追蹤部署狀態。

步驟 8:查看映像檔拉取狀態

點擊對應的實例,監控容器映像檔的下載進度。這個過程可能會花費數分鐘,取決於網路狀況。

步驟 9:驗證部署成功

在實例日誌中尋找 "Application startup complete." 訊息,這代表部署流程已成功完成。

步驟 10:取得存取 URL

點擊 「連接」,再點擊 「連接至 HTTP 服務 [Port 8000]」。由於這是 API 服務,你需要複製對應位址。

網站 URL

完整 Cursor IDE 配置指南

步驟 1:安裝並訂閱 Cursor

  • cursor.com 下載 Cursor IDE
  • 完成 Pro 方案訂購(每月 20 美元)
  • 啟動應用程式

重要:代理模式與編輯功能需要 Cursor Pro 訂閱(每月 20 美元)。

步驟 2:開啟模型設定

在 Cursor 中配置模型

  • 開啟 Cursor 設定(Ctrl+,Cmd+,
  • 前往 「模型」 區段
  • 找到 「API 配置」 區域

步驟 3:配置你的自訂實例

  • ✅ 啟用 「OpenAI API 金鑰」 開關
  • ✅ 啟用 「覆寫 OpenAI 基底 URL」 開關

步驟 4:輸入你的實例憑證

在「OpenAI API 金鑰」欄位:輸入任意值(不可為空)

在「覆寫 OpenAI 基底 URL」欄位:貼上帶有 /v1 尾碼的你的 URL:

https://your-instance-id.novita.ai/v1

⚠️ 關鍵/v1 尾碼是必填的。沒有這個尾碼,Cursor 無法與你的實例通訊。

步驟 5:新增你的自訂模型

  • 點擊 「+ 新增自訂模型」
  • 輸入 Huggingface 上的完全一致的模型名稱
  • 重要:模型名稱必須完全匹配,區分大小寫

步驟 6:儲存並選擇你的模型

  • 儲存你的配置
  • 在 Cursor 的下拉選單中選擇你的自訂模型

測試與驗證

在 Ask 模式中測試

  1. Ask 模式 中開啟新對話
  2. 發送一個簡單的編碼問題
  3. 確認你收到回應

在 Agent 模式中測試

  1. 切換到 Agent 模式
  2. 提出一個多步驟的編碼任務
  3. 確認工具呼叫功能正常運作

常見設定錯誤與解決方案

❌ 模型無回應

解決方案

  • ✅ 確認兩個 API 開關都已啟用
  • ✅ 檢查基底 URL 是否包含 /v1 尾碼
  • ✅ 確認實例狀態顯示為「執行中」
  • ✅ 確認額度充足

❌ 連線被拒

解決方案

  • ✅ 檢查基底 URL 在 /v1沒有尾隨斜線
  • ✅ 確認 URL 中沒有多餘的空格
  • ✅ 確認網路連線正常

❌ 找不到模型名稱

解決方案

  • ✅ 從儀表板複製完全一致的模型名稱
  • ✅ 確認區分大小寫
  • ✅ 確認沒有多餘空格

❌ 功能受限

解決方案

  • ✅ 確認部署時已新增工具呼叫參數
  • ✅ 確認選擇了正確的解析器
  • ✅ 重新啟動 Cursor 應用程式

結論

在 Novita AI 上部署自己的模型並用於 Cursor,能讓你完全掌控 AI 編碼助手。

遵循這份指南,並仔細注意工具呼叫配置與連線參數,你就能成功將自訂 AI 模型與 Cursor 整合,完全掌控你的編碼助手。

Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 來部署 AI 模型,同時也提供實惠且可靠的 GPU 雲端服務,用於建構與擴展 AI 應用。