Novita AI 激动地推出五款性能卓越的 THUDM 模型,在数学和编码方面表现优异:GLM-4-32B-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414、GLM-4-9B-0414 和 GLM-Z1-9B-0414。为支持开发者和开源社区,GLM-4-9B-0414 和 GLM-Z1-9B-0414 现已提供免费 API 访问!
Novita AI 自豪地推出五款顶级 THUDM 模型:GLM-4-32B-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414、GLM-4-9B-0414 和 GLM-Z1-9B-0414。
GLM-4-32B-0414 基于 15T 高质量数据与人类偏好对齐构建,以强大的通用能力领先,在指令遵循、工具使用和搜索问答方面表现出色。
对于追求高性能或高性价比的开发者,Novita AI 现提供 GLM-4-9B-0414 和 GLM-Z1-9B-0414 的免费 API 访问。
什么是 GLM-4 系列模型?

THUDM 的 GLM 系列展现了强大的技术性能,尤其在数学、编码和推理任务中。
- 32B 模型(GLM-4-32B、GLM-Z1-32B、GLM-Z1-Rumination)在 通用能力 ** 与 ** 深度推理 ** 之间取得平衡,其中 GLM-Z1-Rumination 专注于 ** 开放式问题解决与搜索增强推理。
- 9B 模型(GLM-4-9B、GLM-Z1-9B)针对 数学推理 ** 和 ** 通用任务性能 进行了高度优化,在性能与模型规模之间实现了出色的比率,非常适合轻量部署。
GLM-4-32B-Base-0414 是整个系列的技术基础。
- 它在 15T 高质量数据上进行了预训练,其中包含大量以推理为重点的合成数据,为复杂任务处理奠定了坚实基础。
- 训练后优化涉及 人类偏好对齐,增强了模型提供自然且符合用户期望的对话体验的能力。
清晰的模型分层支持不同的开发需求。
- 对于 复杂推理、深度写作和跨领域分析,推荐使用 GLM-Z1-Rumination-32B。
- 对于 强劲的通用性能,GLM-4-32B 是理想选择。
- 对于 预算有限的项目 ** 或 ** 大规模批量操作(例如翻译、问答),免费的 GLM-4-9B 和 GLM-Z1-9B 模型提供了极佳的性价比。
GLM-4-32B-0414 基准测试

GLM-4-32B-0414 的优势领域
指令遵循(IFEval):
GLM-4-32B-0414 在指令理解和执行方面表现出色,在所有模型中取得最高分。
工具使用能力(BFCL-v3 / TAU-Bench):
GLM-4-32B-0414 在多个行业(零售、航空)的工具使用任务中表现卓越,在单轮和多轮场景中均领先或并列第一。
其在复杂的多轮工具使用中优势尤为突出,比第二名模型高出近 10 分。
基于搜索的问答(SimpleQA、HotpotQA):
GLM-4-32B-0414 在搜索问答方面展现出强大能力,在 SimpleQA 中取得最高分(88.1),在 HotpotQA 中几乎与 GPT-4o-1120 持平,同时显著优于 DeepSeek-V3-0324 和 Qwen2.5-Max。
GLM-4 系列能力
代码 vs Gemini 2.5 Flash
如何访问 GLM-4 系列模型?
第一步:登录并访问模型库
登录您的账户,点击 模型库 按钮。

第二步:选择您的模型
浏览可用的选项,选择适合您需求的模型。

第三步:开始免费试用
开始免费试用,探索所选模型的功能。

第四步:获取您的 API 密钥
为了通过 API 进行身份验证,我们将为您提供一个新的 API 密钥。进入“设置”页面,您可以按照图中所示复制 API 密钥。

第五步:安装 API
使用您编程语言对应的包管理器安装 API。

安装完成后,将所需的库导入您的开发环境。使用您的 API 密钥初始化 API,即可开始与 Novita AI LLM 交互。以下是适用于 Python 用户的聊天补全 API 示例。
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "thudm/glm-4-32b-0414"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
结论
GLM-4-32B-0414 在从指令遵循到复杂多轮工具使用的关键 AI 任务中展现了卓越实力。其均衡的能力加上微调后的对话优化,使其成为需要强大、通用模型开发者的理想选择。
有了 Novita AI 的支持,探索 GLM 模型从未如此简单。立即进入模型游乐场,看看 GLM-4 能做什么。
常见问题
GLM-4-32B-0414 与其他模型相比有何特殊之处?
GLM-4-32B-0414 在指令遵循、多轮工具使用和基于搜索的问答方面表现卓越,这得益于广泛的预训练和微调的对话优化。
我可以通过 Novita AI 试用 GLM-4-32B-0414 吗?
是的,GLM-4-32B-0414 已在 Novita AI 上提供,并具有有竞争力的 API 定价,而 GLM-4-9B 和 GLM-Z1-9B 则可免费访问。
GLM-4 系列模型最适合哪些任务?
GLM-4-32B-0414 非常适合需要深度推理、复杂对话和高精度指令执行的任务。
Novita AI 是一个 AI 云平台,为开发者提供通过简单 API 部署 AI 模型的便捷方式,同时还提供经济实惠且可靠的 GPU 云,用于构建和扩展应用。
