MiniMax M3 现已通过 Novita AI 提供,模型 ID 为 minimax/minimax-m3,采用兼容 OpenAI 的基础 URL,支持 1,000,000 token 的上下文窗口,并为较长提示词提供分层定价。本快速入门旨在提供实用设置:复制模型 ID、设置 API 密钥、运行一个小请求,待确认基础功能正常后,再扩展至较长的提示词。
何时使用本快速入门
当你希望通过无服务器 API 路径测试 MiniMax M3,而非围绕原始模型托管构建时,可参考本快速入门。本指南适用于已有提示词或工作负载,需要端点、模型 ID、Token 限制和定价信息,然后编写小型概念验证的开发者。
MiniMax M3 非常适合需要大上下文预算、结构化输出、面向工具的任务,或需要基于长输入进行编码辅助的请求。在 Novita AI 上,当前模型页面列出的可接受输入模态包括 text、image 和 video,输出模态为 text,并支持无服务器访问、函数调用、结构化输出、推理和 Anthropic API 兼容。
本文并非基准测试深度分析或产品发布公告。目标很简单:发一个干净的请求,然后判断 MiniMax M3 是否适合你的应用。
第一步:获取 Novita API 密钥
创建或选择 Novita AI 账号,打开 API 密钥设置,生成一个服务端使用的密钥。请勿将密钥暴露在客户端代码、前端打包文件、公开仓库以及可能共享给团队以外的笔记本中。
在运行示例前,将密钥设置为环境变量:
export NOVITA_API_KEY="your_api_key_here"
如果在团队环境中测试,优先使用作用域限定的项目密钥或临时密钥(如果你的账户支持)。在公开演示、共享实验或任何意外泄露后轮换密钥。
第二步:确认模型 ID 和端点
在编写代码前,请将 MiniMax M3 的连接信息汇总如下:
| 字段 | 值 |
|---|---|
| 模型 ID | minimax/minimax-m3 |
| 基础 URL | https://api.novita.ai/openai |
| 聊天补全 URL | https://api.novita.ai/openai/v1/chat/completions |
| 上下文窗口 | 1,000,000 tokens |
| 最大输出 | 131,072 tokens |
| 输入 | text, image, video |
| 输出 | text |
| 无服务器支持 | 是 |
| 函数调用 | 是 |
| 结构化输出 | 是 |
| 推理 | 是 |
| Anthropic API 兼容 | 是 |
在正式上线前,请查看 MiniMax M3 模型文档,因为可用性、定价和限制可能会变化。
第三步:发送第一个请求
从一个简短的纯文本聊天请求开始。在添加大型提示词之前,调试认证、路由和响应解析要容易得多。
对于第一个提示词,请求一个确定性强、易于验证的输出。例如:总结长上下文代码审查过程中的主要实现风险。
第一次调用时,max_tokens 保持适中。MiniMax M3 支持更长的输出,但首要任务是确认集成是否正常。
第四步:读取响应
兼容 OpenAI 的聊天补全响应通常会在 choices[0].message.content 中返回助手回答。
同时记录运行时暴露的请求 ID 或响应元数据。这些详细信息在请求失败或响应缓慢时非常有用。对于成本跟踪,请记录提示词大小、输出大小、缓存读取量(如果你的工作负载使用了缓存上下文),以及请求是否进入了长上下文定价区间。
不要将第一次输出视为提示词可用于用户的证明。在集成正常后,请测试与你实际工作负载类似的提示词:长代码库、多文件指令、工具模式、结构化 JSON 输出,或需要多模态输入的场景。
第五步:查看定价、限制及常见错误
MiniMax M3 在 Novita AI 上采用分层定价。当提示词进入长上下文区间时,价格会发生变化:
| 提示词大小区间 | 输入 | 输出 | 缓存读取 |
|---|---|---|---|
| 少于 524,288 tokens | 每 1M tokens $0.30 | 每 1M tokens $1.20 | 每 1M tokens $0.06 |
| 524,288 至 1,000,000 tokens | 每 1M tokens $1.20 | 每 1M tokens $4.80 | 每 1M tokens $0.24 |
这个差异很重要。一个 50,000 token 的测试和一个接近 1M token 的请求定价是不同的。在估算成本时,请包括提示词长度、预期输出长度、缓存行为、重试次数以及用户发送超大请求的频率。
MiniMax M3 目前支持 1,000,000 token 上下文窗口和 131,072 token 最大输出。上线前,请重新查看 MiniMax M3 模型文档 获取最新价格表以及与你账户相关的限流指南。
常见设置错误包括:
- 缺少或格式错误的
Authorization头。 - 使用了错误的模型 ID,例如显示名称而非
minimax/minimax-m3。 - 将请求发送到了错误的基础 URL。
- 将
max_tokens设置得过高,超出应用程序能安全处理的范围。 - 未考虑更高定价区间就测试长上下文提示词。
- 以客户端库不支持的方式传递多模态内容。
Python 示例
本示例使用 OpenAI Python SDK 和 Novita AI 兼容 OpenAI 的基础 URL。
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["NOVITA_API_KEY"],
base_url="https://api.novita.ai/openai/v1",
)
response = client.chat.completions.create(
model="minimax/minimax-m3",
messages=[
{
"role": "system",
"content": "你是一个简洁的 API 助手,专为软件团队服务。",
},
{
"role": "user",
"content": "总结长上下文代码审查过程中的主要实现风险。",
},
],
temperature=0.2,
max_tokens=600,
)
answer = response.choices[0].message.content
print(answer)
使用 cURL 发送请求
如果你更喜欢 cURL,请将 JSON 主体保存在 payload 变量中。这使请求更易读,避免将完整 JSON 主体塞进一条命令。
payload='{
"model": "minimax/minimax-m3",
"messages": [
{
"role": "system",
"content": "你是一个简洁的 API 助手,专为软件团队服务。"
},
{
"role": "user",
"content": "总结长上下文代码审查过程中的主要实现风险。"
}
],
"temperature": 0.2,
"max_tokens": 600
}'
curl --request POST "https://api.novita.ai/openai/v1/chat/completions" \
--header "Authorization: Bearer $NOVITA_API_KEY" \
--header "Content-Type: application/json" \
--data "$payload"
关键参数
| 参数 | 控制内容 | 起始建议值 |
|---|---|---|
model |
回答请求的托管模型 | minimax/minimax-m3 |
messages |
系统指令和用户指令 | 一个简短的纯文本提示词 |
temperature |
输出多样性 | 0.2(便于可重复测试) |
max_tokens |
最大生成输出量 | 先设小上限,后续再提高 |
stream |
是否逐 token 流式返回 | 基本调用正常后再启用 |
tools |
函数/工具定义 | 每次只加一个工具 |
response_format |
结构化响应形状 | 使用前先验证输出 |
对于多模态输入,在依赖图像或视频提示词之前,请确认 SDK 或 API 文档中的确切请求格式。模型页面列出了模态支持,但请求格式取决于你使用的客户端路径。
故障排除
认证失败
检查 NOVITA_API_KEY 是否已在运行请求的同一 shell 或运行时中正确设置。授权头必须使用 bearer-token 格式。
API 找不到模型
确认请求中使用的是 minimax/minimax-m3,而不是 MiniMax M3、minimax-m3 或博客标题。模型显示名称和模型 ID 不可互换。
短提示词正常,长提示词失败
请测量序列化后的输入大小,而不仅仅是可见的单词数。工具模式、检索文档、图像引用和对话历史都会计入。如果你接近 1,000,000 tokens,请尝试较小的提示词,并在重试前添加截断或检索逻辑。
账单高于预期
检查提示词是否进入了 524,288 至 1,000,000 token 的定价区间。MiniMax M3 在该长上下文层级中具有更高的输入、输出和缓存读取价格。
结构化输出不一致
从较小的 schema、较低的 temperature 和显式验证开始。如果你的应用程序需要严格的 JSON,请通过验证和重试逻辑处理格式错误的响应,而不是假设每次响应都能解析。
工具调用与你的函数 schema 不匹配
一次只测试一个工具。确保函数名称、描述和参数 schema 清晰,并在执行任何工具调用之前添加服务端验证。
常见问题解答
MiniMax M3 是否可以通过 Novita AI API 使用?
是的。当前 Novita AI 模型页面显示 MiniMax M3 可通过无服务器 API 访问,模型 ID 为 minimax/minimax-m3。
MiniMax M3 的模型 ID 是什么?
使用 minimax/minimax-m3。
应该使用哪个基础 URL?
使用 https://api.novita.ai/openai 作为兼容 OpenAI 的基础 URL。在 OpenAI SDK 中,将 SDK 基础 URL 设置为 https://api.novita.ai/openai/v1。
MiniMax M3 在 Novita AI 上的费用是多少?
MiniMax M3 采用分层定价。对于低于 524,288 tokens 的提示词,输入为每 1M tokens $0.30,输出为每 1M tokens $1.20,缓存读取为每 1M tokens $0.06。对于 524,288 至 1,000,000 tokens 的提示词,输入为每 1M tokens $1.20,输出为每 1M tokens $4.80,缓存读取为每 1M tokens $0.24。
MiniMax M3 是否支持流式传输或多模态输入?
当前模型页面列出了 text、image 和 video 输入,输出为 text。流式行为应在生产使用前通过兼容 OpenAI 的聊天补全路径进行测试。
最大上下文窗口是多少?
MiniMax M3 当前支持 1,000,000 token 上下文窗口,最大输出为 131,072 tokens。
