GLM-4.6 现已在 Novita AI 平台,带来 Zai-org 新一代旗舰模型,在上下文长度、编码性能和代理能力方面均有显著提升。GLM-4.6 采用 355B 参数 MoE(混合专家)架构,性能在开源模型中处于领先地位,代表了 AI 能力的显著提升。
最新版本将上下文窗口从 128K 令牌数量翻倍至 200K,同时在实际编码任务中实现了与 Claude Sonnet 4 几乎相当的性能。无论您是构建 AI 代理、开发复杂应用程序,还是创建自动化解决方案,GLM-4.6 都能通过以下方式提供您所需的功能: Novita AI对开发人员友好的基础设施。
当前定价 Novita AI: 204,800 个 Context,每 1 万个输入令牌 0.6 美元,每 1 万个输出令牌 2.2 美元
GLM-4.6 是什么?
GLM-4.6 是智浦 AI 的新一代旗舰模型,相比 GLM-4.5 有显著提升,性能在开源模型中处于领先地位。它采用 355B 参数 MoE 架构,专为在代理任务、编码应用和复杂推理场景中表现出色而设计。
扩展上下文窗口: GLM-4.6 引入了 200K 令牌上下文窗口(GLM-4.5 中为 128K),使其能够处理更复杂的对话和更大的代码库。这一扩展使开发人员能够处理大量文档、分析更长的代码文件,并在复杂的代理工作流程中维护上下文。
卓越的编码性能: GLM-4.6 在多个基准测试中展现出显著的提升,并在 Claude Code、Cline、Roo Code 和 Kilo Code 等热门编程助手中展现出卓越的实际性能。该模型擅长生成视觉精美的前端页面,并能更准确地处理复杂的开发任务。
增强的推理能力: 该模型的推理能力通过支持推理过程中的工具使用得到了增强,从而在问题解决场景中获得了更佳的性能。GLM-4.6 能够更有效地与代理框架集成,使其成为构建需要多步骤推理和外部工具集成的 AI 自动化系统的理想选择。
精致的写作质量: GLM-4.6 生成的写作在风格和可读性方面更符合人类的偏好,在角色扮演场景和内容生成任务中表现得更自然。
性能基准
GLM-4.6 在涵盖代理、推理和编码能力的综合评估中表现出色。
公共基准测试结果
经八个公开基准测试评估,GLM-4.6 较 GLM-4.5 有显著提升,在开源模型中达到了最佳性能。它的性能与 DeepSeek-V3.2-Exp 和 Claude Sonnet 4 等领先模型相比具有竞争力,但在纯编码能力方面仍落后于 Claude Sonnet 4.5。

实际性能(CC-Bench)
在扩展的 CC-Bench 评估中,人类评估者使用隔离的 Docker 容器内的 GLM-4.6 完成前端开发、工具构建、数据分析、测试和算法实现的多轮任务。
结果表明,GLM-4.6 的性能与 Claude Sonnet 4 几乎相当,达到了 赢率48.6% 同时明显优于其他开源模型。

代币效率
GLM-4.6 完成任务大约 代币减少 15% 比 GLM-4.5 更快,从而具有更快的响应时间、更低的计算成本,并保持或提高了输出质量。
GLM-4.6 入门指南 Novita AI 平台
Novita AI 提供多种访问 GLM-4.6 的方式,针对不同的技能水平和用例而设计。
使用游乐场(无需编码)
立即免费注册 并开始尝试 GLM-4.6 通过交互式界面,只需几秒钟即可完成。测试提示,使用完整的 200K 上下文窗口实时查看输出,并将 GLM-4.6 与其他领先模型进行比较。非常适合在构建完整实现之前进行原型设计和了解模型的功能。
通过 API 集成(针对开发人员)
使用以下方式将 GLM-4.6 连接到您的应用程序 Novita AI的统一 REST API。
直接 API 集成(Python 示例)
从 openai 导入 OpenAI 客户端 = OpenAI(base_url="https://api.novita.ai/openai", api_key="", ) model = "zai-org/glm-4.6" stream = True # 或 False max_tokens = 49152 system_content = "做一个有用的助手" temperature = 1 top_p = 1 min_p = 0 top_k = 50 presence_penalty = 0 frequency_penalty = 0 repetition_penalty = 1 response_format = { "type": "text" } chat_completion_res = client.chat.completions.create( model=model, messages=[ { "role": "system", "content": system_content, }, { "role": "user", "content": "Hi there!", } ], stream=stream, max_tokens=max_tokens, temperature=temperature, top_p=top_p, presence_penalty=presence_penalty, frequency_penalty=frequency_penalty, response_format=response_format,extra_body={“top_k”:top_k,“repetition_penalty”:repetition_penalty,“min_p”:min_p})如果流:对于chat_completion_res中的块:打印(chunk.choices[0].delta.content或“”,end="")否则:打印(chat_completion_res.choices[0].message.content)
使用 OpenAI Agents SDK 的多代理工作流
构建具有即插即用集成、支持切换、路由和与完整 200K 上下文窗口的工具集成的复杂多代理系统。
与第三方平台连接
编码代理: 通过与 OpenAI 兼容的 API 和与 Anthropic 兼容的 API 与 Claude Code、Cursor、Codex、Trae、Qwen Code 和 Cline 等流行的编码助手集成。
编排框架: 使用官方连接器与 LangChain、Dify、CrewAI 和 Langflow 连接。
抱脸: Novita AI 是 Hugging Face 的官方推理提供商,确保广泛的生态系统兼容性。
结语
GLM-4.6 开启 Novita AI 智浦AI新一代旗舰模型,拥有355B参数的MoE架构和200万个上下文窗口,在开源模型中达到了最佳性能。GLM-4.6的性能与Claude Sonnet 4(48.6%的胜率)相当,且代币效率比GLM-4.5提升15%,代表着人工智能能力的显著飞跃。
开始探索 GLM-4.6 今天通过 Novita AI的游乐场,API或第三方集成,通过出色的编码帮助、精致的写作和强大的推理能力来增强您的开发工作流程。
Novita AI 是一个人工智能云平台,它为开发人员提供了一种使用我们简单的 API 轻松部署人工智能模型的方法,同时还提供经济实惠且可靠的 GPU 用于构建和扩展的云。
探索 Novita 的更多内容
订阅即可将最新帖子发送到您的电子邮箱。




