GLM-5 在 Novita AI 上:从“氛围式编码”到“智能体工程”的范式转变深度解析

GLM-5 在 Novita AI 上:从“氛围式编码”到“智能体工程”的范式转变深度解析

Z. AI 正式发布其最新旗舰模型 GLM-5。这款模型在智能效率方面实现了巨大飞跃,专为复杂系统工程和长周期智能体任务而设计。GLM-5 现已通过 Novita AI 的 API 开放使用,您可以快速原型验证,并在验证可行后进行扩展。

本文将带您了解 GLM-5 是什么、基准测试表现如何,以及如何开始使用它——首先在 Playground 中体验,然后通过 API/SDK 集成,包括开发者已使用的“第三方平台”方案。

🙌Novita AI 作为官方发布合作伙伴,为 GLM-5 提供第 0 天支持。这意味着开发者无需管理基础设施或等待分阶段上线,即可立即通过稳定的 API 访问该模型。

立即尝试 GLM-5!

GLM-5 是什么?

GLM-5 是 Z.ai 推出的新一代旗舰基础模型,旨在实现智能体工程 (Agentic Engineering)——不仅仅是“写个函数”,而是“交付功能”,具备规划、工具使用和长周期一致性。它专门针对复杂系统工程和长期智能体任务进行了定位,官方文档强调其实际编码能力已接近开发者工作流中的前沿闭源模型。

GLM-5 概览

项目 详情
组织 Z.ai
发布日期 2026 年 2 月 12 日
参数量 总计 744B,激活 40B (MoE)
架构 MoE + 长上下文优化(包含 DeepSeek 稀疏注意力)
上下文窗口 约 200K tokens

基准测试与性能

Z.ai 的官方文档将 GLM-5 描述为从“氛围式编码”(一次性代码生成)到智能体执行(多步规划 + 工具编排 + 调试循环)的阶跃变化。这些改进源于模型规模扩展和训练栈升级:更大的模型规模、更多的预训练数据,以及专有的异步强化学习系统(“Slime”),旨在使后训练更高效。

对比性能分析

以下数据将 GLM-5 与其他前沿模型进行了对比,包括 Claude Opus 4.5、Gemini 3 Pro 和 GPT-5.2 (xhigh)。

GLM-5 的基准测试结果

来源:Z.AI

关键洞察:

  • 工具使用与搜索领先:Humanity’s Last Exam (HLE) with Tools (50.4) 和 BrowseComp (75.9) 中,GLM-5 超越了所有竞争对手,表明其在管理外部上下文和执行多步信息检索方面具有卓越能力。
  • 代际增长: 与 GLM-4.7 相比,GLM-5 在多个方面取得了巨大进步,尤其是在 Terminal-Bench 2.0(从 41.0 提升至 56.2)和 MCP-Atlas(从 52.0 提升至 67.8)。
  • 系统工程前沿:SWE-bench VerifiedTerminal-Bench 2.0 等编码密集型基准测试中,GLM-5 直接挑战 Claude Opus 4.5,证明了其应对高级工程任务的能力。
  • 经济效益: 虽然比前代更强大,GLM-5 在 Vending Bench 2 中保持了均衡的成本曲线,在处理高复杂度任务时往往比 Gemini 3 Pro 或 Claude Opus 4.5 更高效。

CC-Bench-V2:真实世界软件工程性能

CC-Bench-V2 上的内部评估表明,GLM-5 相比前代 GLM-4.7 实现了显著飞跃,并在生产级工程任务中正直接挑战——在某些情况下已超越——Claude Opus 4.5。

CC-Bench-V2:GLM-4.7 vs GLM-5 vs Claude Opus 4.5

来源:Z.AI

关键洞察:

  • 前端开发卓越: 在前端任务中,GLM-5 实现了 98.0% 的构建成功率,比 GLM-4.7 提升了 26%,并显著高于 Claude Opus 4.5 的 93.0%。其 端到端正确率 (74.8%) 也与 Claude Opus 4.5 (75.7%) 相当。
  • 后端工程: GLM-5 在后端正确性上较上一代提升了 6.2%,达到 25.8%,几乎与 Claude Opus 4.5 的 26.9% 持平。
  • 卓越的长期探索能力: GLM-5 的突出特点之一是在大型代码库中进行导航的能力。在 大仓探索 中,GLM-5 得分 65.6%,优于 Claude Opus 4.5 的 64.5%。

快速开始:通过 Playground 进行交互式探索

在深入代码之前,体验 GLM-5 能力的最快方式是通过 Novita AI Playground

Playground 提供了一个零代码的交互界面,您可以:

  • 测试推理深度: 开启“思考模式”以查看模型内部的逐步逻辑。
  • 调整参数: 微调 Temperature(0.0 至 1.0)和 Top_p,以控制输出的创造性与确定性。
  • 上下文压力测试: 粘贴长达 200K tokens 的大型文档或日志,测试模型的召回和理解能力。

对于新用户,注册 Novita AI 账户通常会获得免费试用积分,让您无需初始成本即可对 GLM-5 进行数十次测试。

前往 Playground

Novita Playground:您可以无需代码和配置即可尝试 GLM-5

Novita AI Playground

如何在 Novita AI 上访问 GLM-5

Novita AI 提供了多种将 GLM-5 集成到生产环境的方法,所有这些方法均由我们高性价比的无服务器 GPU 基础设施支持。

方法 1:通过 API 使用 GLM-5

🎉在 Novita AI 上,GLM-5 的定价具有竞争力:每 1M 输入 Tokens $1每 1M 输出 Tokens $3.2,并通过缓存读取大幅节省成本,仅需 每 1M Tokens $0.2

我们的 API 完全兼容 OpenAI 标准,只需更改 base URL 和 API key 即可轻松迁移。

  • Base URL: https://api.novita.ai/openai
  • 模型 ID: zai-org/glm-5

如何获取 API Keys

获取 API Key

  • 步骤 1:创建或登录您的账户:访问 [https://novita.ai](https://novita.ai) 并注册或登录。
  • 步骤 2:导航至密钥管理:登录后,找到“API Keys”。
  • 步骤 3:创建新密钥:点击“Add New Key”按钮。
  • 步骤 4:立即保存您的密钥:密钥生成后立即复制并存储;它只显示一次。

创建您自己的 API key 的指南

如何获取 API Key

使用以下代码示例与我们的 API 集成:

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="zai-org/glm-5",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=131072,
    temperature=0.7
)

print(response.choices[0].message.content)

方法 2:Python SDK 集成

如需更流畅的体验,请使用 Novita AI Python SDK。该 SDK 支持流式输出函数调用等高级功能,这些功能对于构建实时交互式智能体至关重要。

方法 3:第三方平台

Novita AI 上的 GLM-5 可与业界最流行的编排框架无缝连接:

  • 智能体框架和应用构建器: 关于 ContinueAnythingLLMLangChainLangflow 的集成指南。
  • Hugging Face Hub: Novita 被列为推理提供商,支持通过 Hugging Face 的提供商生态系统运行支持的模型。
  • 兼容 OpenAI 的工具: Novita 遵循 OpenAI API 标准,因此您只需进行最小更改即可连接 OpenAI 风格的应用和工具,例如 ClineCursorTraeQwen Code
  • 兼容 Anthropic 的访问: Novita 还支持 Anthropic SDK 兼容集成,适用于 Claude Code 风格的工作流。
  • OpenCode 与可观测性: 直接在 OpenCode 中使用 Novita。

结论

GLM-5 是开放权重模型实力的证明。通过将 744B 参数规模与 MoE 和 DSA 架构的效率相结合,它为全球最昂贵的闭源模型提供了一个可行的高性能替代方案。

准备好开始您的智能体工程之旅了吗? 如果您想快速使用 GLM-5,最实用的路径是:在 Playground 中测试 GLM-5 → 通过 Novita AI 的 API 集成 → 扩展验证有效的方案。

Novita AI 是一个 AI 云平台,为开发者提供了一种通过简单 API 部署 AI 模型的方式,同时也提供经济实惠且可靠的 GPU 云,用于构建和扩展应用。

常见问题解答

GLM-5 是什么?

GLM-5 是 Z.ai 最新推出的旗舰大型语言模型,专为智能体工程(多步推理、工具使用、最长约 200K Tokens 的长上下文理解以及复杂编码工作流)而设计。

GLM-5 是开源的吗?

是的。GLM-5 已以开放权重形式发布,允许开发者在许可协议下下载、部署和微调。

如何使用 GLM-5?

您可以通过云 API(例如 Novita AI 的 API),通过在线 Playground 进行快速测试,或通过自托管开放权重并使用推理框架(如 vLLM)来使用 GLM-5。