Novita AI 推出顶级 THUDM 模型：GLM-4 系列模型

什么是 GLM-4 系列模型？
GLM-4-32B-0414 基准测试
GLM-4 系列能力
如何访问 GLM-4 系列模型？
结论
常见问题

Novita AI 激动地推出五款性能卓越的 THUDM 模型，在数学和编码方面表现优异：GLM-4-32B-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414、GLM-4-9B-0414 和 GLM-Z1-9B-0414。为支持开发者和开源社区，GLM-4-9B-0414 和 GLM-Z1-9B-0414 现已提供免费 API 访问！

Novita AI 自豪地推出五款顶级 THUDM 模型：GLM-4-32B-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414、GLM-4-9B-0414 和 GLM-Z1-9B-0414。
GLM-4-32B-0414 基于 15T 高质量数据与人类偏好对齐构建，以强大的通用能力领先，在指令遵循、工具使用和搜索问答方面表现出色。
对于追求高性能或高性价比的开发者，Novita AI 现提供 GLM-4-9B-0414 和 GLM-Z1-9B-0414 的免费 API 访问。

什么是 GLM-4 系列模型？

THUDM 的 GLM 系列展现了强大的技术性能，尤其在数学、编码和推理任务中。

32B 模型（GLM-4-32B、GLM-Z1-32B、GLM-Z1-Rumination）在 通用能力 ** 与 ** 深度推理 ** 之间取得平衡，其中 GLM-Z1-Rumination 专注于 ** 开放式问题解决与搜索增强推理。
9B 模型（GLM-4-9B、GLM-Z1-9B）针对 数学推理 ** 和 ** 通用任务性能 进行了高度优化，在性能与模型规模之间实现了出色的比率，非常适合轻量部署。

GLM-4-32B-Base-0414 是整个系列的技术基础。

它在 15T 高质量数据上进行了预训练，其中包含大量以推理为重点的合成数据，为复杂任务处理奠定了坚实基础。
训练后优化涉及 人类偏好对齐，增强了模型提供自然且符合用户期望的对话体验的能力。

清晰的模型分层支持不同的开发需求。

对于 复杂推理、深度写作和跨领域分析，推荐使用 GLM-Z1-Rumination-32B。
对于 强劲的通用性能，GLM-4-32B 是理想选择。
对于 预算有限的项目 ** 或 ** 大规模批量操作（例如翻译、问答），免费的 GLM-4-9B 和 GLM-Z1-9B 模型提供了极佳的性价比。

GLM-4-32B-0414 基准测试

GLM-4-32B-0414 的优势领域

指令遵循（IFEval）：
GLM-4-32B-0414 在指令理解和执行方面表现出色，在所有模型中取得最高分。

工具使用能力（BFCL-v3 / TAU-Bench）：
GLM-4-32B-0414 在多个行业（零售、航空）的工具使用任务中表现卓越，在单轮和多轮场景中均领先或并列第一。
其在复杂的多轮工具使用中优势尤为突出，比第二名模型高出近 10 分。

基于搜索的问答（SimpleQA、HotpotQA）：
GLM-4-32B-0414 在搜索问答方面展现出强大能力，在 SimpleQA 中取得最高分（88.1），在 HotpotQA 中几乎与 GPT-4o-1120 持平，同时显著优于 DeepSeek-V3-0324 和 Qwen2.5-Max。

GLM-4 系列能力

代码 vs Gemini 2.5 Flash

如何访问 GLM-4 系列模型？

第一步：登录并访问模型库

登录您的账户，点击 模型库 按钮。

立即试用 GLM-4 Demo！

第二步：选择您的模型

浏览可用的选项，选择适合您需求的模型。

第三步：开始免费试用

开始免费试用，探索所选模型的功能。

第四步：获取您的 API 密钥

为了通过 API 进行身份验证，我们将为您提供一个新的 API 密钥。进入“设置”页面，您可以按照图中所示复制 API 密钥。

第五步：安装 API

使用您编程语言对应的包管理器安装 API。

安装完成后，将所需的库导入您的开发环境。使用您的 API 密钥初始化 API，即可开始与 Novita AI LLM 交互。以下是适用于 Python 用户的聊天补全 API 示例。

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "thudm/glm-4-32b-0414"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

结论

GLM-4-32B-0414 在从指令遵循到复杂多轮工具使用的关键 AI 任务中展现了卓越实力。其均衡的能力加上微调后的对话优化，使其成为需要强大、通用模型开发者的理想选择。
有了 Novita AI 的支持，探索 GLM 模型从未如此简单。立即进入模型游乐场，看看 GLM-4 能做什么。

常见问题

GLM-4-32B-0414 与其他模型相比有何特殊之处？

GLM-4-32B-0414 在指令遵循、多轮工具使用和基于搜索的问答方面表现卓越，这得益于广泛的预训练和微调的对话优化。

我可以通过 Novita AI 试用 GLM-4-32B-0414 吗？

是的，GLM-4-32B-0414 已在 Novita AI 上提供，并具有有竞争力的 API 定价，而 GLM-4-9B 和 GLM-Z1-9B 则可免费访问。

GLM-4 系列模型最适合哪些任务？

GLM-4-32B-0414 非常适合需要深度推理、复杂对话和高精度指令执行的任务。

Novita AI 是一个 AI 云平台，为开发者提供通过简单 API 部署 AI 模型的便捷方式，同时还提供经济实惠且可靠的 GPU 云，用于构建和扩展应用。

Novita AI 推出顶级 THUDM 模型：GLM-4 系列模型

什么是 GLM-4 系列模型？

GLM-4-32B-0414 基准测试

GLM-4-32B-0414 的优势领域

GLM-4 系列能力

代码 vs Gemini 2.5 Flash

如何访问 GLM-4 系列模型？

结论

常见问题

推荐阅读

Product

RESOURCES

Partners

Company

什么是 GLM-4 系列模型？

GLM-4-32B-0414 基准测试

GLM-4-32B-0414 的优势领域

GLM-4 系列能力

代码 vs Gemini 2.5 Flash

如何访问 GLM-4 系列模型？

结论

常见问题

推荐阅读

相关文章

Product

RESOURCES

Partners

Company