Novita AI 推出顶级 THUDM 模型:GLM-4 系列模型

Novita AI 推出顶级 THUDM 模型:GLM-4 系列模型

Novita AI 激动地推出五款性能卓越的 THUDM 模型,在数学和编码方面表现优异:GLM-4-32B-0414GLM-Z1-32B-0414GLM-Z1-Rumination-32B-0414GLM-4-9B-0414GLM-Z1-9B-0414。为支持开发者和开源社区,GLM-4-9B-0414GLM-Z1-9B-0414 现已提供免费 API 访问!

Novita AI 自豪地推出五款顶级 THUDM 模型:GLM-4-32B-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414、GLM-4-9B-0414 和 GLM-Z1-9B-0414。
GLM-4-32B-0414 基于 15T 高质量数据与人类偏好对齐构建,以强大的通用能力领先,在指令遵循、工具使用和搜索问答方面表现出色。
对于追求高性能或高性价比的开发者,Novita AI 现提供 GLM-4-9B-0414GLM-Z1-9B-0414 的免费 API 访问。

什么是 GLM-4 系列模型?

glm模型

THUDM 的 GLM 系列展现了强大的技术性能,尤其在数学、编码和推理任务中。

  • 32B 模型(GLM-4-32B、GLM-Z1-32B、GLM-Z1-Rumination)在 通用能力 ** 与 ** 深度推理 ** 之间取得平衡,其中 GLM-Z1-Rumination 专注于 ** 开放式问题解决与搜索增强推理
  • 9B 模型(GLM-4-9B、GLM-Z1-9B)针对 数学推理 ** 和 ** 通用任务性能 进行了高度优化,在性能与模型规模之间实现了出色的比率,非常适合轻量部署。

GLM-4-32B-Base-0414 是整个系列的技术基础。

  • 它在 15T 高质量数据上进行了预训练,其中包含大量以推理为重点的合成数据,为复杂任务处理奠定了坚实基础。
  • 训练后优化涉及 人类偏好对齐,增强了模型提供自然且符合用户期望的对话体验的能力。

清晰的模型分层支持不同的开发需求。

  • 对于 复杂推理、深度写作和跨领域分析,推荐使用 GLM-Z1-Rumination-32B。
  • 对于 强劲的通用性能,GLM-4-32B 是理想选择。
  • 对于 预算有限的项目 ** 或 ** 大规模批量操作(例如翻译、问答),免费的 GLM-4-9B 和 GLM-Z1-9B 模型提供了极佳的性价比。

GLM-4-32B-0414 基准测试

glm基准测试

GLM-4-32B-0414 的优势领域

指令遵循(IFEval):
GLM-4-32B-0414 在指令理解和执行方面表现出色,在所有模型中取得最高分。

工具使用能力(BFCL-v3 / TAU-Bench):
GLM-4-32B-0414 在多个行业(零售、航空)的工具使用任务中表现卓越,在单轮和多轮场景中均领先或并列第一。
其在复杂的多轮工具使用中优势尤为突出,比第二名模型高出近 10 分。

基于搜索的问答(SimpleQA、HotpotQA):
GLM-4-32B-0414 在搜索问答方面展现出强大能力,在 SimpleQA 中取得最高分(88.1),在 HotpotQA 中几乎与 GPT-4o-1120 持平,同时显著优于 DeepSeek-V3-0324 和 Qwen2.5-Max。

GLM-4 系列能力

代码 vs Gemini 2.5 Flash

如何访问 GLM-4 系列模型?

第一步:登录并访问模型库

登录您的账户,点击 模型库 按钮。

登录并访问模型库

立即试用 GLM-4 Demo!

第二步:选择您的模型

浏览可用的选项,选择适合您需求的模型。

novita ai上的glm模型

第三步:开始免费试用

开始免费试用,探索所选模型的功能。

开始免费试用

第四步:获取您的 API 密钥

为了通过 API 进行身份验证,我们将为您提供一个新的 API 密钥。进入“设置”页面,您可以按照图中所示复制 API 密钥。

获取API密钥

第五步:安装 API

使用您编程语言对应的包管理器安装 API。

安装API

安装完成后,将所需的库导入您的开发环境。使用您的 API 密钥初始化 API,即可开始与 Novita AI LLM 交互。以下是适用于 Python 用户的聊天补全 API 示例。

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "thudm/glm-4-32b-0414"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  
  

结论

GLM-4-32B-0414 在从指令遵循到复杂多轮工具使用的关键 AI 任务中展现了卓越实力。其均衡的能力加上微调后的对话优化,使其成为需要强大、通用模型开发者的理想选择。
有了 Novita AI 的支持,探索 GLM 模型从未如此简单。立即进入模型游乐场,看看 GLM-4 能做什么。

常见问题

GLM-4-32B-0414 与其他模型相比有何特殊之处?

GLM-4-32B-0414 在指令遵循、多轮工具使用和基于搜索的问答方面表现卓越,这得益于广泛的预训练和微调的对话优化。

我可以通过 Novita AI 试用 GLM-4-32B-0414 吗?

是的,GLM-4-32B-0414 已在 Novita AI 上提供,并具有有竞争力的 API 定价,而 GLM-4-9B 和 GLM-Z1-9B 则可免费访问。

GLM-4 系列模型最适合哪些任务?

GLM-4-32B-0414 非常适合需要深度推理、复杂对话和高精度指令执行的任务。

Novita AI 是一个 AI 云平台,为开发者提供通过简单 API 部署 AI 模型的便捷方式,同时还提供经济实惠且可靠的 GPU 云,用于构建和扩展应用。

推荐阅读