如何在 Novita AI 上部署自己的模型并在 Cursor 中使用:2025 完整设置指南

如何在 Novita AI 上部署自己的模型并在 Cursor 中使用:2025 完整设置指南

想要完全控制哪个 AI 模型为你的编码助手提供支持?本指南将详细展示如何在 Novita AI 的 GPU 基础设施上部署你自己的自定义模型,并将其无缝集成到 Cursor IDE 中。与使用预配置的 API 端点不同,部署自己的实例让你对模型选择、配置和性能优化拥有完全控制权。

实践示例:DeepSeek-R1-Distill-Qwen-1.5B

第一步:确定模型的基础架构

访问 https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B。复制模型名称以备后用。

第二步:找到对应的解析器

查阅 vLLM 工具调用 文档。对于 Qwen-2.5 系列模型,使用 hermes 解析器。

为什么工具调用对编码助手很重要

Cursor 并非仅仅发送提示并接收文本回复。它需要能够与开发环境交互、理解多个文件上下文并执行特定操作的模型。工具调用正是实现这些能力的桥梁。

不同的模型系列需要不同的解析器。请查阅 vLLM 工具调用文档,将你的模型与正确的解析器类型匹配。

第三步:创建你的 Novita AI 账户

  • 访问 Novita AI 平台
  • 点击 “注册” 立即访问
  • 注册后自动获得 1 美元免费积分

第四步:模板选择

从模型库中选择 DeepSeek-R1-Distill-Qwen-1.5B 模板,或者创建你自己的模板。

选择 4090

第五步:参数确认

检查配置界面上显示的部署参数。验证所有设置正确无误后,点击 下一步 继续。

容器启动参数 字段中添加:

--enable-auto-tool-choice --tool-call-parser hermes

重要提示:解析器必须与你的模型系列匹配。请查阅 vLLM 文档以获取正确的解析器。

使用模板

第六步:实例部署

点击 部署 启动实例创建过程。系统将开始配置你的 GPU 实例。

部署模板

第七步:监控部署进度

导航至 实例管理 访问控制台。此仪表盘可让你实时跟踪部署状态。

第八步:查看镜像拉取状态

点击你的具体实例,监控容器镜像下载进度。根据网络状况,此过程可能需要几分钟。

第九步:验证部署成功

在实例日志中查找 "Application startup complete." 消息。这表明部署过程已成功完成。

第十步:获取访问 URL

点击 “连接”,然后点击 “连接到 HTTP 服务 [端口 8000]”。由于这是一个 API 服务,你需要复制该地址。

网站 URL

完整的 Cursor IDE 配置指南

第一步:安装并订阅 Cursor

  • cursor.com 下载 Cursor IDE
  • 完成 Pro 计划购买(每月 20 美元)
  • 启动应用程序

重要提示:Agent 模式和编辑功能需要 Cursor Pro 订阅(每月 20 美元)。

第二步:访问模型设置

在 Cursor 中配置模型

  • 打开 Cursor 设置(Ctrl+,Cmd+,
  • 导航至 “Models” 部分
  • 找到 “API Configuration” 区域

第三步:配置你的自定义实例

  • ✅ 启用 “OpenAI API Key” 开关
  • ✅ 启用 “Override OpenAI Base URL” 开关

第四步:输入你的实例凭据

在 “OpenAI API Key” 字段中:输入任意值(不能为空)

在 “Override OpenAI Base URL” 字段中:粘贴你的 URL 并添加 /v1 后缀:

https://your-instance-id.novita.ai/v1

⚠️ 关键/v1 后缀是 必需的。没有它,Cursor 无法与你的实例通信。

第五步:添加你的自定义模型

  • 点击 “+ Add Custom Model”
  • 输入 Huggingface 上的 确切模型名称
  • 重要提示:模型名称必须完全匹配——区分大小写

第六步:保存并选择你的模型

  • 保存配置
  • 在 Cursor 的下拉菜单中选择你的自定义模型

测试与验证

在 Ask 模式下测试

  1. Ask 模式 下开始新聊天
  2. 发送一个简单的编码问题
  3. 验证是否收到回复

在 Agent 模式下测试

  1. 切换至 Agent 模式
  2. 请求一个多步骤编码任务
  3. 验证工具调用功能是否正常工作

常见设置错误及解决方案

❌ 模型无响应

解决方法

  • ✅ 确认两个 API 开关都已启用
  • ✅ 检查 Base URL 是否包含 /v1 后缀
  • ✅ 确认实例状态显示为 “Running”
  • ✅ 验证积分充足

❌ 连接被拒绝

解决方法

  • ✅ 检查 Base URL 在 /v1没有尾部斜杠
  • ✅ 确保 URL 中没有多余空格
  • ✅ 验证网络连接

❌ 模型名称未找到

解决方法

  • ✅ 从仪表盘复制确切的模型名称
  • ✅ 检查大小写敏感性
  • ✅ 验证没有多余空格

❌ 功能受限

解决方法

  • ✅ 验证部署时是否添加了工具调用参数
  • ✅ 检查是否正确选择了解析器
  • ✅ 重启 Cursor 应用程序

结论

在 Novita AI 上部署你自己的模型用于 Cursor,可以让你完全控制 AI 编码助手。

通过遵循本指南,并特别注意工具调用配置和连接参数,你可以成功地将自定义 AI 模型与 Cursor 集成,并完全掌控你的编码助手。

Novita AI 是一个 AI 云平台,为开发者提供通过简单 API 轻松部署 AI 模型的能力,同时提供经济实惠且可靠的 GPU 云用于构建和扩展。