想要完全控制哪个 AI 模型为你的编码助手提供支持?本指南将详细展示如何在 Novita AI 的 GPU 基础设施上部署你自己的自定义模型,并将其无缝集成到 Cursor IDE 中。与使用预配置的 API 端点不同,部署自己的实例让你对模型选择、配置和性能优化拥有完全控制权。
实践示例:DeepSeek-R1-Distill-Qwen-1.5B
第一步:确定模型的基础架构
访问 https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B。复制模型名称以备后用。
第二步:找到对应的解析器
查阅 vLLM 工具调用 文档。对于 Qwen-2.5 系列模型,使用 hermes 解析器。
为什么工具调用对编码助手很重要
Cursor 并非仅仅发送提示并接收文本回复。它需要能够与开发环境交互、理解多个文件上下文并执行特定操作的模型。工具调用正是实现这些能力的桥梁。
不同的模型系列需要不同的解析器。请查阅 vLLM 工具调用文档,将你的模型与正确的解析器类型匹配。
第三步:创建你的 Novita AI 账户
- 访问 Novita AI 平台
- 点击 “注册” 立即访问
- 注册后自动获得 1 美元免费积分
第四步:模板选择
从模型库中选择 DeepSeek-R1-Distill-Qwen-1.5B 模板,或者创建你自己的模板。

第五步:参数确认
检查配置界面上显示的部署参数。验证所有设置正确无误后,点击 下一步 继续。
在 容器启动参数 字段中添加:
--enable-auto-tool-choice --tool-call-parser hermes
重要提示:解析器必须与你的模型系列匹配。请查阅 vLLM 文档以获取正确的解析器。

第六步:实例部署
点击 部署 启动实例创建过程。系统将开始配置你的 GPU 实例。

第七步:监控部署进度
导航至 实例管理 访问控制台。此仪表盘可让你实时跟踪部署状态。

第八步:查看镜像拉取状态
点击你的具体实例,监控容器镜像下载进度。根据网络状况,此过程可能需要几分钟。

第九步:验证部署成功
在实例日志中查找 "Application startup complete." 消息。这表明部署过程已成功完成。

第十步:获取访问 URL
点击 “连接”,然后点击 “连接到 HTTP 服务 [端口 8000]”。由于这是一个 API 服务,你需要复制该地址。


完整的 Cursor IDE 配置指南
第一步:安装并订阅 Cursor
- 从 cursor.com 下载 Cursor IDE
- 完成 Pro 计划购买(每月 20 美元)
- 启动应用程序
重要提示:Agent 模式和编辑功能需要 Cursor Pro 订阅(每月 20 美元)。
第二步:访问模型设置

- 打开 Cursor 设置(Ctrl+, 或 Cmd+,)
- 导航至 “Models” 部分
- 找到 “API Configuration” 区域
第三步:配置你的自定义实例
- ✅ 启用 “OpenAI API Key” 开关
- ✅ 启用 “Override OpenAI Base URL” 开关
第四步:输入你的实例凭据
在 “OpenAI API Key” 字段中:输入任意值(不能为空)
在 “Override OpenAI Base URL” 字段中:粘贴你的 URL 并添加 /v1 后缀:
https://your-instance-id.novita.ai/v1
⚠️ 关键:/v1 后缀是 必需的。没有它,Cursor 无法与你的实例通信。
第五步:添加你的自定义模型
- 点击 “+ Add Custom Model”
- 输入 Huggingface 上的 确切模型名称
- 重要提示:模型名称必须完全匹配——区分大小写
第六步:保存并选择你的模型
- 保存配置
- 在 Cursor 的下拉菜单中选择你的自定义模型
测试与验证
在 Ask 模式下测试
- 在 Ask 模式 下开始新聊天
- 发送一个简单的编码问题
- 验证是否收到回复
在 Agent 模式下测试
- 切换至 Agent 模式
- 请求一个多步骤编码任务
- 验证工具调用功能是否正常工作
常见设置错误及解决方案
❌ 模型无响应
解决方法:
- ✅ 确认两个 API 开关都已启用
- ✅ 检查 Base URL 是否包含
/v1后缀 - ✅ 确认实例状态显示为 “Running”
- ✅ 验证积分充足
❌ 连接被拒绝
解决方法:
- ✅ 检查 Base URL 在
/v1后 没有尾部斜杠 - ✅ 确保 URL 中没有多余空格
- ✅ 验证网络连接
❌ 模型名称未找到
解决方法:
- ✅ 从仪表盘复制确切的模型名称
- ✅ 检查大小写敏感性
- ✅ 验证没有多余空格
❌ 功能受限
解决方法:
- ✅ 验证部署时是否添加了工具调用参数
- ✅ 检查是否正确选择了解析器
- ✅ 重启 Cursor 应用程序
结论
在 Novita AI 上部署你自己的模型用于 Cursor,可以让你完全控制 AI 编码助手。
通过遵循本指南,并特别注意工具调用配置和连接参数,你可以成功地将自定义 AI 模型与 Cursor 集成,并完全掌控你的编码助手。
Novita AI 是一个 AI 云平台,为开发者提供通过简单 API 轻松部署 AI 模型的能力,同时提供经济实惠且可靠的 GPU 云用于构建和扩展。
