通过 Novita AI 在 Claude Code 中使用 MiniMax M2.7

通过 Novita AI 在 Claude Code 中使用 MiniMax M2.7

MiniMax M2.7 在 Novita AI 上可通过 Anthropic 兼容端点使用,这意味着你只需设置四个环境变量即可将其接入 Claude Code,无需其他更改。输入成本为每百万 tokens $0.3——大约比 Claude Opus 4.6 便宜 23 倍——同时该模型在 40+ 个并发工具中保持 97% 的 tool-call 准确率。本指南涵盖确切的设置步骤、已验证的规格、成本计算以及值得了解的权衡。

快速回答: 在启动 Claude Code 前,设置 ANTHROPIC_BASE_URL=https://api.novita.ai/anthropicANTHROPIC_AUTH_TOKEN=<你的密钥>ANTHROPIC_MODEL=minimax/minimax-m2.7。这就是完整的集成。

在 Novita AI 上试用 MiniMax M2.7

为什么 M2.7 能作为 Claude Code 的后端

Claude Code 将每个文件读取、终端命令和编辑都通过工具调用进行路由。背后的模型需要在长周期、多步骤的会话中可靠地调用这些工具——不仅仅是在简单提示下。

M2.7 的亮点数据是:在 40+ 个并发工具(每个工具定义超过 2000 tokens)下,技能跟随准确率达到 97%。这直接对应 Claude Code 的工具面:ReadWriteEditBashGlobGrepWebFetch 等。而工具遵循能力较弱的模型会在会话中途丢失参数或调用错误函数,M2.7 则能保持准确性。

另一个相关的数字是上下文窗口:204,800 tokens。这足以在上下文中保留大型代码库、对话历史记录和工具结果,而无需在任务中途强制压缩。

M2.7 在 Claude Code 中擅长的领域:

  • 需要持续工具链的多文件重构
  • 生产调试工作流(日志分析 → 数据库查询 → 修复)
  • SWE-Bench 风格的任务:SWE-Bench Pro 56.2%,Multi-SWE-Bench 52.7%
  • 需要角色一致、多轮推理的代理工作流
  • 运行大量并发会话的成本敏感型团队

需要调整预期的地方:

  • 仅文本输入模式(不支持图像或文件上传到模型)
  • 204,800 tokens 的上下文窗口很大,但不及 M3 的 1M 层级
  • 自托管部署需要大量 GPU —— API 访问是更实际的路径

Novita AI 上的 MiniMax M2.7 API 规格

字段
模型 ID minimax/minimax-m2.7
Anthropic 基础 URL https://api.novita.ai/anthropic
OpenAI 基础 URL https://api.novita.ai/openai/v1
上下文窗口 204,800 tokens
最大输出 131,072 tokens
输入模态 文本
输出模态 文本
支持特性 函数调用、结构化输出、推理、JSON 模式、Anthropic API 兼容
输入定价 每 1M tokens $0.30
输出定价 每 1M tokens $1.20
缓存读取定价 每 1M tokens $0.06
检查日期 2026-07-03,来源:Novita AI 模型页面Novita 上的 MiniMax M2.7

Anthropic 兼容端点(/anthropic)是 Claude Code 使用的。OpenAI 兼容端点可用于直接 API 调用和其他工具。

步骤 1:获取你的 Novita AI API 密钥

  1. 访问 novita.ai 并创建账户(免费注册)
  2. 导航到 设置 → API 密钥
  3. 点击 创建新密钥,命名(例如 claude-code-m2.7),并复制密钥
  4. 不要将密钥放在源代码、公共仓库或共享笔记本中

将其存储为环境变量,而不是硬编码在任何地方:

export NOVITA_API_KEY="your_key_here"

步骤 2:安装 Claude Code

如果已安装 Claude Code,请跳到步骤 3。

macOS、Linux 或 WSL:

curl -fsSL https://claude.ai/install.sh | bash

Windows PowerShell:

irm https://claude.ai/install.ps1 | iex

Windows CMD:

curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd

Windows 用户需要先安装 Git for Windows

验证安装:

claude --version

步骤 3:配置环境变量

Claude Code 读取四个变量以将请求路由到自定义模型端点。在启动 Claude Code 之前设置它们。

macOS 和 Linux:

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<你的 Novita API 密钥>"
export ANTHROPIC_MODEL="minimax/minimax-m2.7"
export ANTHROPIC_SMALL_FAST_MODEL="minimax/minimax-m2.7"

Windows PowerShell:

$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "<你的 Novita API 密钥>"
$env:ANTHROPIC_MODEL = "minimax/minimax-m2.7"
$env:ANTHROPIC_SMALL_FAST_MODEL = "minimax/minimax-m2.7"

ANTHROPIC_SMALL_FAST_MODEL 控制轻量级操作,如文件导航和快速搜索。将其设置为相同的模型可确保所有请求使用相同的计费路径和定价。

要使配置持久化,可将 export 行添加到你的 shell 配置文件(~/.bashrc~/.zshrc 或 PowerShell 配置文件)中。或者保留项目级别的 .env 文件,并在每次会话前加载它——只是不要将其提交到版本控制。

步骤 4:启动 Claude Code 并验证

导航到你的项目目录并启动 Claude Code:

cd your-project-directory
claude .

在提示符下,运行一个快速测试:

> 这个目录里有哪些文件?

如果模型通过调用相应的工具返回文件列表,则集成成功。你可以确认所使用的模型并在 Novita AI 使用量仪表板 中查看每次请求的 token 成本。

如果看到身份验证错误,请检查 ANTHROPIC_AUTH_TOKEN 是否在当前 shell 会话中设置——而不仅仅是在另一个终端窗口中。

步骤 5:优化代理工作流

M2.7 的 97% 工具遵循率和 204,800 tokens 上下文使其非常适合扩展的代理会话。以下是一些充分利用这些能力的实践:

先让模型了解整个代码库上下文。 在请求更改之前,让 Claude Code 读取相关文件。M2.7 的大上下文窗口意味着你可以加载多个模块而不会过早达到限制。

> 读取 src/api/ 中的所有文件,并识别任何处理身份验证的函数

对于复杂工作使用显式任务分解。 将大型请求分解为顺序步骤,减少部分输出或会话中途混乱的可能性:

> 首先,分析当前数据库模式。然后提出添加软删除所需的迁移方案。暂时不要编写任何代码。

利用工具链进行调试。 M2.7 在生产调试方面的优势在多步骤序列中最为明显:复现 → 追踪 → 修复 → 验证。

> 运行测试套件,识别失败的测试,在源代码中找到根本原因,并提出修复方案

保持会话专注。 M2.7 处理多轮连贯性表现良好,但具有明确目标的较窄会话比方向频繁变化的开放式探索性会话产生更可靠的输出。

成本分析

在输入/输出每百万 tokens $0.3/$1.2 的价格下,M2.7 比大多数前沿选项便宜得多,同时在代理基准测试中保持竞争力。

使用 Novita AI 上的 M2.7 进行典型 Claude Code 工作流成本:

工作流 预估成本
小型重构(5 个文件,约 200 行改动) $0.02–$0.05
功能实现(20 个文件,约 1000 行) $0.10–$0.20
完整代码库分析(100+ 个文件) $0.25–$0.60
以 100 tokens/秒连续编码一小时 ~$0.27

Claude Code 使用的模型成本对比:

模型 输入每 1M tokens 输出每 1M tokens 相比 M2.7 输入
MiniMax M2.7 (Novita AI) $0.30 $1.20
MiniMax M2.5 (Novita AI) $0.30 $1.20 相同
GLM-5 (Novita AI) $1.00 $3.20 3.3 倍
Claude Opus 4.6 ~$7.00 ~$21.00 23 倍

来源:Novita AI 模型页面,检查日期 2026-07-03。在预算生产工作负载前请验证当前定价。

提示缓存进一步降低了重复上下文的成本。缓存读取价格为 $0.06/Mt,在具有稳定系统提示或大量共享上下文的工作负载中受益显著。

实际使用案例

多文件重构。 M2.7 在 Multi-SWE-Bench 上达到 52.7%,表明它能够处理复杂的跨文件更改。Claude Code 提供交互式审批层——在提交每个建议更改前进行审查。

生产 SRE 和事件响应。 该模型在生产调试场景上进行了训练:关联指标、查询数据库、追踪根本原因、应用非阻塞修复。Claude Code 的终端集成使其能够在同一会话中运行诊断并验证修复。

代理框架开发。 如果你正在构建编排其他工具或模型的东西,M2.7 的原生 Agent Teams 支持和角色一致性使其成为编排层的可靠选择。其 97% 的工具遵循率比原始基准分数更重要。

多语言代码库。 M2.7 在多种编程语言中表现出强劲性能,并能处理多语言项目,而不会出现某些主要针对 Python/JavaScript 训练的模型可能出现的质量下降。

扩展代理工作流的成本敏感型团队。 在 $0.30/Mt 输入价格下,跨多个开发者运行连续 Claude Code 会话的团队可以保持成本可控,而不必降级到显著较弱的模型。

故障排除

身份验证错误(401)

检查 ANTHROPIC_AUTH_TOKEN 是否在当前活动的 shell 会话中设置。该变量必须在运行 claude . 之前导出。如果怀疑密钥损坏,最快的方法是重新生成密钥并重新导出。

模型未找到

确认模型 ID 完全为 minimax/minimax-m2.7——没有空格,没有大小写更改。显示名称如 MiniMax M2.7 不能作为模型 ID 使用。

请求到达 Anthropic 而非 Novita

验证 ANTHROPIC_BASE_URL 是否设置为 https://api.novita.ai/anthropic。如果该变量缺失或为空,Claude Code 将回退到 Anthropic 的端点,并在没有有效 Anthropic 密钥的情况下拒绝请求。

首次请求响应慢

会话中的第一个请求可能因冷启动行为而多花几秒。同一会话中的后续请求通常更快。如果慢速持续存在于所有请求,尝试在测试调用中减少 max_tokens,以隔离是生成时间还是网络延迟。

上下文窗口错误

M2.7 支持 204,800 tokens。如果你正在加载非常大的代码库,Claude Code 的上下文管理会自动进行压缩。如需手动控制,请限制你在单次交互中要求 Claude Code 读取的文件数量。

成本高于预期

检查 ANTHROPIC_SMALL_FAST_MODEL。如果它指向一个不同的、更昂贵的模型,诸如目录导航等轻量级操作的成本将高于预期。将两个变量都设置为 minimax/minimax-m2.7 可使所有流量归一化。

常见问题 (FAQ)

MiniMax M2.7 在 Novita AI 上是否提供 Anthropic 兼容端点?

是的。该模型以 minimax/minimax-m2.7 提供,同时支持 OpenAI 兼容端点和 Anthropic 兼容端点。Claude Code 使用 https://api.novita.ai/anthropic 的 Anthropic 路径。

对于 Claude Code 工作流,M2.7 和 M2.5 有什么区别?

M2.7 在所有基准测试中都更强:SWE-Bench Pro 从 52.2% 提升到 56.2%,Multi-SWE-Bench 从 51.3% 提升到 52.7%,MLE-Bench lite 从 31.5% 提升到 66.6%。定价相同(每百万 tokens $0.3/$1.2),因此没有成本上的理由在新设置中使用 M2.5 而非 M2.7。

M2.7 在 Claude Code 中是否支持视觉或图像输入?

不支持。MiniMax M2.7 仅支持文本。如果你的工作流涉及截图、UI 分析或图像上下文,则需要多模态模型。对于基于文本的编码工作流,此限制不适用。

我可以在 Claude Code 中一边使用 M2.7 一边使用 MCP 工具吗?

是的。Claude Code 的 MCP(模型上下文协议)支持在工具层工作,而非模型层。M2.7 的高工具遵循率使其成为 MCP 密集型设置的理想候选。

函数调用是否能可靠地用于 Claude Code 的内置工具?

是的。M2.7 专门为高工具调用准确率进行了训练——在生产条件下,在 40+ 个并发工具中达到 97% 的遵循率。Claude Code 的内置工具(Read、Write、Edit、Bash、Glob、Grep)在此范围内表现良好。

此设置是否适用于 Claude Code 的 VS Code 扩展?

环境变量适用于 CLI 运行时。如果你使用 VS Code 扩展,请在 shell 配置文件中或 VS Code 的集成终端设置中设置这些变量,以便扩展启动 Claude Code 会话时它们可用。

推荐文章

MiniMax M2.7 在 Novita AI:顶级智能,亲民定价 完整发布覆盖:M2.7 的自我进化架构、基准测试结果、代理能力,以及与 Novita AI 上 GLM-5 和 Kimi K2.5 的定价对比。

在 Claude Code 中使用 MiniMax M2.5:代理编码指南 M2.5 的相同集成模式——如果你正在比较 M2.5 和 M2.7 以选择工作流,或从现有 M2.5 设置迁移到 M2.7,此文章很有用。

如何在 Claude Code 中使用 GLM-5:设置指南 通过 Novita AI 在 Claude Code 中设置 GLM-5 的指南——该模型在智能指数上最接近 M2.7 的基准测试,但具有不同的定价和上下文大小。


Novita AI 是 AI 与代理云平台,帮助开发者和初创公司构建、部署和扩展模型及代理应用,提供高性能、可靠性和成本效益。