Novita AI 上的 Qwen3.7-Max:面向长上下文工作流的智能体编码
Qwen3.7-Max 现已通过 Novita AI 的无服务器 API(Serverless API)提供,供开发者构建智能体编码系统、长上下文助手以及使用工具的文本工作流。在 Novita AI 模型页面上,端点列为 qwen/qwen3-max,因此在调用 API 时应使用该模型 ID,即使您的文章、路线图或发布说明中按产品名称引用了 Qwen3.7-Max。
该模型对智能体构建者很重要,因为 Qwen 的发布材料强调了仓库编辑、终端式任务、规划、指令遵循以及长时间自主执行。实际要义现在很简单:团队可以通过 Novita AI 兼容 OpenAI 的无服务器 API 测试此模型,然后评估其以智能体为中心的行为是否能改善自己的编码和自动化工作流。
从 Novita AI 上的 Qwen3 Max 模型页面 开始,或通过 Novita AI 兼容 OpenAI 的 API 连接。将定价、上下文限制和模型 ID 与您在生产环境中使用的 Novita AI 列信息保持一致。
Qwen3.7-Max 在 Novita AI 上的可用性
Novita AI 将 Qwen3 Max 列为模型 ID qwen/qwen3-max,并表示可通过 Novita 的无服务器 API 使用。模型页面上的 API 示例使用兼容 OpenAI 的基础 URL https://api.novita.ai/openai 和模型值 qwen/qwen3-max。
| 可用性项目 | Novita AI 列信息 |
|---|---|
| Novita 模型页面标题 | Qwen3 Max |
| API 调用时的模型 ID | qwen/qwen3-max |
| 接入路径 | Novita AI 无服务器 API |
| API 基础 URL | https://api.novita.ai/openai |
| 输入能力 | 文本 |
| 输出能力 | 文本 |
| 模型页面 | Novita AI 上的 Qwen3 Max |
最后验证时间:2026-05-22,来自 Novita AI 模型页面。
Qwen 的外部发布材料还讨论了百联(Bailian)可用性、区域部署模式、Anthropic API 兼容性、Responses API 工具、思考和非思考模式,以及 preserve_thinking 用于长时间运行的智能体任务。请将这些视为发布和供应商上下文细节。对于此 Novita AI 端点,请以 Novita 模型页面为准,获取模型 ID、无服务器 API 路径、限制和定价。
Novita AI 端点规格
Novita AI 端点适用于需要大上下文窗口、结构化响应和工具兼容输出的文本优先智能体工作流。列出的上下文长度为 262144 个 token,最大输出为 65536 个 token。
| 规格 | Novita AI 上的 Qwen3 Max |
|---|---|
| 供应商 | Qwen |
| 量化 | fp8 |
| 上下文长度 | 262144 |
| 最大输出 | 65536 |
| 无服务器 | 支持 |
| 函数调用 | 支持 |
| 结构化输出 | 支持 |
| 输入/输出能力 | 文本/文本 |
最后验证时间:2026-05-22,来自 Novita AI 模型页面。
一些 Qwen 发布材料中描述了 Qwen3.7-Max 具有 1M token 的上下文窗口。这是发布材料中的说法,不应视为当前 Novita AI 端点的限制。对于 Novita AI 的使用和成本规划,所列端点的上下文长度为 262144 个 token。
如何通过 Novita AI 调用 Qwen3.7-Max
Novita AI 通过兼容 OpenAI 的接口公开该模型。关键实现细节是模型 ID:调用 qwen/qwen3-max,而不是基于 Qwen3.7-Max 发布标签猜测的端点名称。
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key="YOUR_NOVITA_API_KEY",
)
response = client.chat.completions.create(
model="qwen/qwen3-max",
messages=[
{"role": "system", "content": "你是一位细心的编码助手。"},
{"role": "user", "content": "总结失败的测试并提出修复方案。"},
],
max_tokens=4096,
temperature=0.2,
)
print(response.choices[0].message.content)
对于生产环境中的智能体工作流,请为输出 token、工具调用次数、执行时间和重试行为设置单独的配额。65536 token 的最大输出为长时间推理轨迹或详细编辑提供了空间,但大多数编码智能体任务仍受益于有限的响应和显式的验证步骤。
Qwen3 Max 在 Novita AI 上的定价
Novita AI 列出了标题性的每百万 token 定价以及按输入长度分层的定价。请使用 Novita AI 模型页面进行 Novita 计费决策;Qwen 或阿里云的定价可以作为有用的外部供应商上下文,但不应混入 Novita AI 定价表。
| 输入长度 | 输入价格 | 输出价格 |
|---|---|---|
| 1 到 32767 tokens | $0.845 / M tokens | $3.38 / M tokens |
| 32768 到 131071 tokens | $1.40 / M tokens | $5.64 / M tokens |
| 131072 到 258047 tokens | $2.11 / M tokens | $8.45 / M tokens |
最后验证时间:2026-05-22,来自 Novita 模型页面。模型页面还列出了标题性的输入/输出定价为 $2.11 / M tokens 和 $8.45 / M tokens。
定价层级对智能体编码很重要,因为长仓库上下文、重复的工具摘要以及冗长的输出可能会将请求推入更高层级。在扩展使用之前,请使用真实上下文打包、检索和输出限制来测试代表性任务,以便测量的成本反映您的实际框架。
为什么 Qwen3.7-Max 对智能体编码很重要
编码智能体不再局限于短代码补全提示。它们阅读问题线程、检查仓库、运行命令、处理错误、修改文件,并通过测试或人工审查验证结果。在这种场景下,模型需要在长上下文中维护指令、可靠地选择工具,并在中间步骤失败时恢复。
Qwen 的发布材料强调了智能体编码和工具使用基准,例如 Terminal-Bench 2.0 Terminus 72.3、SWE-Pro 60.4、SWE-Multilingual 78.4、NL2Repo 47.3、SciCode 52.7、MCP-Mark 64.6、Deep-Planning 63.1、GPQA Diamond 92.2、IFBench 81.2 和 SpreadSheetBench 84.5。这些是有用的方向性信号,但应视为 Qwen 报告的发布基准,不能保证适用于私有代码库。
更好的评估模式是从您自己的工作构建一个私有任务集:失败的测试、依赖升级、bug 修复、带有验收标准的重构、文档相关的更改以及依赖工具的自动化流程。使用您当前基线所用的相同框架、超时、检索设置和审查标准,通过 Novita AI 对 Qwen3.7-Max 运行评估。
适合的使用场景
当工作负载是文本优先、上下文密集且面向工具时,Novita AI 上的 Qwen3.7-Max 是一个强有力的候选。该端点的结构化输出和函数调用支持使其特别适用于需要可预测中间数据或工具参数的智能体框架。
- 仓库级编码智能体:检查文件、提出补丁并推理测试结果。
- 长上下文工程助手:总结问题历史、拉取请求反馈和源文件。
- 办公和数据自动化智能体:结合提取、电子表格逻辑和结构化输出。
- 研究助手:需要文本提取、规划和多步骤综合。
- 工具调用系统:函数调用和结构化输出是核心需求。
由于 Novita AI 列信息显示文本输入和文本输出,因此它并非原生图像或视频理解的首选。对于简单的提取、分类或路由任务,一个更小、成本更低的模型可能已经满足质量要求,因此使用 Qwen3.7-Max 可能有些大材小用。
团队应如何评估
使用任务级指标评估 Qwen3.7-Max,而不是提示措辞的印象。对于编码智能体,追踪完成率、测试通过率、审查干预率、工具调用次数、挂钟时间、输入 token、输出 token 和回归率。对于业务自动化智能体,追踪提取准确性、模式有效性、下游接受度和人工修正时间。
- 选择 20 到 50 个代表目标智能体工作负载的真实任务。
- 固定框架、工具、检索设置、超时和重试策略。
- 在相同条件下运行 Novita AI 端点
qwen/qwen3-max和当前基线。 - 使用测试、结构化评分标准和人工审查对输出进行评分。
- 根据 total input tokens、output tokens、延迟和分层的成本比较质量。
如果您的评估包括代码执行或浏览器自动化,请将模型测试与隔离的运行时配对。Novita AI 智能体沙盒 可以为智能体工作流提供受控的执行环境,而 Qwen3 Max 模型页面 是通过 Novita AI 测试此模型的直接入口点。
常见问题
Qwen3.7-Max 在 Novita AI 上可用吗?
是的。Novita AI 将 Qwen3 Max 列为可通过无服务器 API 使用,模型 ID 为 qwen/qwen3-max。
开发者应使用哪个模型 ID?
使用 qwen/qwen3-max,配合 Novita AI 兼容 OpenAI 的 API 基础 URL https://api.novita.ai/openai。
Novita AI 为此端点列出了多少上下文长度?
Novita AI 模型页面列出 qwen/qwen3-max 端点的上下文长度为 262144 个 token,最大输出为 65536 个 token。
Novita AI 端点是否支持函数调用和结构化输出?
是的。Novita AI 将函数调用和结构化输出均列为 qwen/qwen3-max 所支持的功能。
结论
Qwen3.7-Max 现在是一个经过验证的 Novita AI 模型发布故事,而不仅仅是外部供应商的更新。使用 Novita AI 无服务器 API 的模型 ID qwen/qwen3-max,围绕所列的 262144 token 上下文长度和 65536 token 最大输出进行规划,并在扩展生产使用之前,在真实的智能体编码和长上下文工作流上评估模型。
