GLM-4.6 上线Novita AI：Zai-org新一代旗舰模型，支持200K上下文窗口

什么是GLM-4.6？
性能基准测试
在Novita AI平台上手使用GLM-4.6
总结

GLM-4.6 现已上线 Novita AI 平台，这是Zai-org的新一代旗舰模型，在上下文长度、编码性能和智能体能力方面均有重大提升。该模型采用355B参数的混合专家（MoE, Mixture of Experts）架构，在开源模型中达到顶尖性能水平，代表了AI能力的重大飞跃。

本次最新版本将上下文窗口从128K token翻倍提升至200K token，在实际编码任务中的表现接近Claude Sonnet 4。无论你是构建AI智能体、开发复杂应用，还是打造自动化解决方案，GLM-4.6 都能通过Novita AI 对开发者友好的基础设施，为你提供所需的能力。

Novita AI 当前定价： 204,800 上下文长度，输入token $0.6/百万，输出token $2.2/百万

试用GLM-4.6演示

什么是GLM-4.6？

GLM-4.6 是Zhipu AI的新一代旗舰模型，相比GLM-4.5实现了显著提升，在开源模型中达到顶尖性能。该模型基于355B参数的MoE架构构建，专门针对智能体任务、编码应用和复杂推理场景进行了优化。

扩展的上下文窗口： GLM-4.6 引入了200K token的上下文窗口（较GLM-4.5的128K有所提升），能够处理更复杂的对话和更大的代码库。这一扩展让开发者可以处理大量文档、分析更长的代码文件，并在复杂的智能体工作流中保持上下文连贯。

更优的编码性能： GLM-4.6 在多项基准测试中都有显著提升，在Claude Code、Cline、Roo Code、Kilo Code等主流编码助手中的实际表现尤为出色。该模型擅长生成视觉精美的前端页面，并能以更高的准确性处理复杂的开发任务。

增强的推理能力： 该模型通过支持推理过程中的工具调用强化了推理能力，在问题解决场景中的表现更出色。GLM-4.6 能更高效地集成到智能体框架中，非常适合构建需要多步推理和外部工具集成的AI驱动自动化系统。

更优质的文本生成质量： GLM-4.6 生成的文本在风格和可读性上更符合人类偏好，在角色扮演场景和内容生成任务中的表现更加自然。

性能基准测试

GLM-4.6 在覆盖智能体、推理和编码能力的综合评估中表现优异。

公开基准测试结果

在8项公开基准测试中，GLM-4.6 相比GLM-4.5有明显提升，在开源模型中达到顶尖性能。其表现与DeepSeek-V3.2-Exp、Claude Sonnet 4等领先模型相当，但在纯编码能力上仍略逊于Claude Sonnet 4.5。

实际性能表现（CC-Bench）

在扩展的CC-Bench评估中，人类评估人员在隔离的Docker容器中使用GLM-4.6 完成了前端开发、工具构建、数据分析、测试和算法实现等多轮任务。

评估结果显示，GLM-4.6 的表现接近Claude Sonnet 4，胜率达到48.6%，明显优于其他开源模型。

Token利用率

完成相同任务时，GLM-4.6 使用的token数量比GLM-4.5少约15%，响应速度更快，计算成本更低，同时输出质量保持甚至有所提升。

在Novita AI平台上手使用GLM-4.6

Novita AI 提供了多种GLM-4.6 的访问方式，适配不同技能水平和使用场景。

使用在线演练场（无需编码）

点击注册即可通过交互式界面在几秒内开始试用GLM-4.6。你可以测试提示词，在完整的200K上下文窗口下实时查看输出，并将GLM-4.6与其他领先模型进行对比。非常适合在开发完整实现前进行原型验证，了解模型的能力边界。

通过API集成（面向开发者）

你可以通过Novita AI的统一REST API 将GLM-4.6 接入你的应用。

直接API集成（Python示例）

 from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key="",
)

model = "zai-org/glm-4.6"
stream = True # or False
max_tokens = 49152
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

使用OpenAI Agents SDK构建多智能体工作流

借助即插即用的集成能力、任务交接支持、路由功能以及完整的200K上下文窗口，你可以构建功能强大的多智能体系统。

对接第三方平台

编码智能体： 通过OpenAI兼容API和Anthropic兼容API，对接Claude Code、Cursor、Codex、Trae、Qwen Code、Cline等主流编码助手。

编排框架： 通过官方连接器对接LangChain、Dify、CrewAI和Langflow。

Hugging Face： Novita AI 是Hugging Face的官方推理服务提供商，确保广泛的生态兼容性。

总结

Novita AI 平台上的GLM-4.6 提供了Zhipu AI的新一代旗舰模型，采用355B参数的MoE架构和200K上下文窗口，在开源模型中达到顶尖性能。其表现接近Claude Sonnet 4（胜率48.6%），token利用率比GLM-4.5高15%，代表了可及AI能力的重大飞跃。

立即通过Novita AI的演练场、API或第三方集成开始探索GLM-4.6，用出色的编码辅助、优质的文本生成和强大的推理能力提升你的开发工作流。

Novita AI 是一个AI云平台，为开发者提供简单的API来部署AI模型，同时提供高性价比、可靠的GPU云服务，用于AI应用的构建和扩展。

GLM-4.6 上线Novita AI：Zai-org新一代旗舰模型，支持200K上下文窗口

什么是GLM-4.6？