Claude Code 需要一个强大的编码模型来释放其全部智能体潜力——而 MiniMax M2.5 恰好满足这一需求。 该模型在 SWE-Bench Verified 上获得 80.2% 的得分,在 BrowseComp 上获得 76.3%,通过 Novita AI 的 API 以每百万输入令牌仅 0.3 美元的价格,提供最先进的智能体编码和工具调用能力。
本指南将详细展示如何使用 Novita AI 作为 API 提供商,将 MiniMax M2.5 集成到 Claude Code 中,帮助你选择合适的工作流程。
快速解答: 在 Claude Code 中使用 MiniMax M2.5,通过 Novita AI 可获得 80.2% 的 SWE-Bench 成功率,每百万令牌费用为 0.3/1.2 美元(输入/输出)——是目前最具成本效益的智能体编码方案之一。
为什么 MiniMax M2.5 与 Claude Code 配合最佳
MiniMax M2.5 不仅仅是又一个编码模型——它专门针对智能体工作流进行了优化。 以下是它成为 Claude Code 理想搭配的原因:

数据来源:Minimax
1. 最先进的智能体编码性能
M2.5 经过数十万个复杂真实世界环境的强化学习训练,在自主编码任务中取得了突破性成果。SWE-Bench Verified 上 80.2% 的得分使其跻身解决真实 GitHub 问题的最佳模型之列,而 Multi-SWE-Bench 上 51.3% 的得分则展示了其处理复杂多文件重构的能力。
| 基准测试 | 得分 | 衡量指标 |
|---|---|---|
| SWE-Bench Verified | 80.2% | 真实 GitHub 问题解决 |
| Multi-SWE-Bench | 51.3% | 复杂多文件任务 |
| BrowseComp | 76.3% | 网页浏览与工具使用 |
2. 智能体任务的极致速度
M2.5 完成 SWE-Bench 评估的速度比 M2.1 快 37%,与 Claude Opus 4.6 的速度相当。这意味着你的 Claude Code 工作流完成更快,智能体操作之间的等待时间更短。
3. 大规模部署成本效益高
M2.5 每百万输入令牌仅需 0.3 美元,以中等价位提供前沿模型性能。 以每秒 100 令牌持续运行,每小时成本仅为 1 美元——这使得长期运行的智能体任务变得切实可行,而使用高级模型则成本过高。
4. 丰富的工具调用与搜索集成
该模型在 BrowseComp 上 76.3% 的得分展示了其复杂的工具使用能力。在 Claude Code 中,这意味着可靠的中端操作、文件系统导航和 API 集成,而无需频繁的重试循环。
5. 多语言编码优势
M2.5 在多语言编程任务中表现尤为出色,非常适合需要在单个工作流中支持 Python、JavaScript、TypeScript、Rust 和 Go 的多语言代码库。
6. 实时智能体反馈循环
Claude Code 的交互式环境受益于 M2.5 高效的任务分解能力。该模型将复杂请求拆分为逻辑步骤,顺序执行,并根据运行时反馈进行调整——这正是调试和迭代开发所需要的。
什么是 Claude Code?
Claude Code 是 Anthropic 官方提供的用于智能体编码的 CLI 和桌面工具。 与传统 IDE 不同,它可以运行自主编码智能体,能够读取文件、执行命令、浏览文档并在整个项目中编写代码。通过配置自定义模型端点,你可以将默认的 Claude 模型替换为 MiniMax M2.5 等替代方案,以实现成本优化或特定任务。
关键功能: 终端自动化、多文件重构、实时错误调试、API 集成,以及带人工审核的自主任务执行。
如何在 Claude Code 中使用 MiniMax M2.5
前置条件
- 已安装 Claude Code CLI 或桌面应用(从 claude.com/claude-code 获取)
- 拥有 Novita AI 账户及 API 密钥(novita.ai 提供免费套餐)
- 基本终端/命令行知识
步骤 1:获取 Novita AI API 密钥
Novita AI 为 MiniMax M2.5 提供兼容 Anthropic 的端点,集成过程简单直接:

- 访问 novita.ai 并创建账户
- 在控制面板中导航至 API Keys 部分
- 点击 Create New Key 并复制生成的密钥
- 安全保存——下一步中会用到
步骤 2:安装 Claude Code
#macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash
#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex
#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd
Windows 需要 Git for Windows。 如果尚未安装,请先安装。
步骤 3:配置 Claude Code 环境变量
Claude Code 使用环境变量将请求路由到自定义模型端点。启动 Claude Code 前请设置以下四个变量:
对于 macOS/Linux:
# 设置 Novita 提供的兼容 Anthropic SDK 的 API 端点
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
# 设置 Novita 提供的模型
export ANTHROPIC_MODEL="minimax/minimax-m2.5"
export ANTHROPIC_SMALL_FAST_MODEL="minimax/minimax-m2.5"
对于 Windows(PowerShell):
$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "Novita API Key"
$env:ANTHROPIC_MODEL = "minimax/minimax-m2.5"
$env:ANTHROPIC_SMALL_FAST_MODEL = "minimax/minimax-m2.5"
专业提示: 将 ANTHROPIC_MODEL 和 ANTHROPIC_SMALL_FAST_MODEL 都设置为 “minimax/minimax-m2.5”,以确保所有操作使用相同模型,保持一致性。
步骤 4:启动 Claude Code
接下来,进入你的项目目录并启动 Claude Code。Claude Code 会分析当前项目目录并将其作为工作上下文。你将在新的交互式会话中看到 Claude Code 提示符。
cd <你的项目目录>
claude .
用一个简单的编码任务测试,确认模型正常响应。你应该能感受到更快的响应时间,并在 Novita AI 使用仪表板中看到每百万令牌 0.30/1.20 美元的定价。
步骤 5:针对智能体工作流进行优化
MiniMax M2.5 擅长多步骤任务。 要在 Claude Code 中获得最佳效果:
- 启用上下文管理: M2.5 拥有 196,608 令牌的上下文窗口,足以处理大型代码库——让它先读取多个文件,然后再进行更改
- 使用显式的任务分解: 在执行前要求提供逐步计划(例如:“首先分析代码库,然后提出更改方案,最后实施”)
- 利用工具调用: M2.5 强大的工具使用能力意味着你可以在单个工作流中链式调用终端命令、文件操作和 API 调用
- 审批迭代: Claude Code 的人工参与模式与 M2.5 的高效推理相得益彰——在执行每一步前先进行审查
- 在 Claude Code 中使用 Git: Claude Code 可以让 Git 操作变得对话式,你也可以提示它进行更复杂的 Git 操作。
成本分析:在 Claude Code 中运行 MiniMax M2.5
通过 Novita AI 的定价:
| 令牌类型 | 每百万令牌价格 | 典型使用场景 |
|---|---|---|
| 输入 | $0.30 | 读取代码、上下文、提示词 |
| 输出 | $1.2 | 生成代码、回复 |
典型 Claude Code 工作流的成本示例:
- 小型重构(5 个文件,200 行变更): $0.03-0.05
- 功能实现(20 个文件,1000 行): $0.13-0.20
- 全代码库分析(100+ 文件): $0.33-0.72
- 以 100 令牌/秒持续编码一小时: $0.27-0.33
成本优势: MiniMax M2.5 每百万令牌仅需 0.3/1.2 美元,比高级替代方案便宜约 40%,同时提供可比的 SWE-Bench 性能——非常适合高吞吐量的智能体工作流。
MiniMax M2.5 + Claude Code 的真实用例
1. 多文件重构
M2.5 在 Multi-SWE-Bench 上 51.3% 的得分意味着它可以处理跨数十个文件的复杂重构。Claude Code 提供了交互式环境,可以在提交前批准每项更改。
2. Bug 调查与修复
该模型的高效推理将调试分解为逻辑步骤:重现 bug、识别根因、提出修复方案、测试解决方案。Claude Code 的终端集成使其能够实时运行测试并验证修复。
3. API 集成开发
M2.5 在 BrowseComp 上 76.3% 的得分展示了其强大的网页/API 交互能力。可用它来搭建新的 API 客户端、添加认证、实现限流,并编写集成测试。
4. 文档生成
该模型读取你的整个代码库上下文(最多 196K 令牌),并生成全面的文档。Claude Code 的文件操作功能使其能够就地更新 README 文件、文档字符串和 API 文档。
5. 框架迁移
从 React 迁移到 Vue,或从 Express 迁移到 Fastify?M2.5 的多语言编码优势和系统化方法能够高效处理这些大规模转换,Claude Code 则提供逐步审批关卡。
如果你正在构建智能体编码工作流,需要在没有高级定价的情况下获得强大的 SWE-Bench 性能,那么通过 Novita AI 在 Claude Code 中使用的 MiniMax M2.5 是你的最佳配置。只需设置四个环境变量,你就可以以每小时 0.3 美元的成本运行自主编码智能体。
常见问题解答
我可以在 Claude Code 之外的其他编码工具中使用 MiniMax M2.5 吗?
可以——Novita AI 的兼容 Anthropic 的端点适用于任何接受自定义 API 端点的工具,包括 Cursor、Continue 和 Trae。
在 Claude Code 中用于编码,MiniMax M2.5 与 Claude Sonnet 相比如何?
M2.5 在 SWE-Bench 上达到 80.2%,每百万令牌费用为 0.3/1.2 美元,而 Claude Sonnet 4 得分更高但费用也显著更高——M2.5 在吞吐量大的工作流中提供了更好的性价比。
MiniMax M2.5 是否支持用于 Claude Code 中工具使用的函数调用?
是的——该模型在 BrowseComp 上 76.3% 的得分展示了其复杂的工具调用能力,与 Claude Code 的终端和文件系统工具完全兼容。
Novita AI 是 AI 与智能体云平台,帮助开发者和初创公司以高性能、高可靠性和高成本效益构建、部署和扩展模型及智能体应用。
推荐阅读
如何在 Claude Code 中使用 GLM-5:设置指南
[适用于 Cursor 的 Kimi k2.5 API:开发者指南](http://Kimi k2.5 API for Cursor: Developer Guide)
