本文旨在帮助你了解GLM 4.5的独特之处,更重要的是,教你如何访问并将其用于你的项目。 无论你是寻找入门点的初学者,还是希望通过API或本地部署深度集成的开发者,本指南将带你了解所有可用选项。读完本文,你将掌握实用步骤,在自己的工作流中充分发挥GLM-4.5的潜力。
什么是GLM 4.5?
GLM-4.5是GLM系列的最新成果,基于复杂的混合专家(MoE)架构构建,专门针对智能体应用优化。该模型有两个版本:
- GLM-4.5(旗舰模型):
3550亿总参数,其中活跃参数为320亿。 - GLM-4.5-Air(高效版本):
1060亿总参数,其中活跃参数为120亿。
GLM 4.5的核心架构创新
- 更深的模型结构:
- 降低宽度(更小的隐藏维度和更少的专家数量),同时增加深度(更多层),从而实现更出色的推理能力。
- 超大规模语料预训练:
- 模型在包含15万亿token的庞大通用语料上进行了预训练,确保知识覆盖广泛全面。
- 开源强化学习基础设施(“slime”):
- 高度灵活、高效、可扩展的强化学习(RL)平台,专为大规模智能体强化学习任务设计。
- 专用强化学习阶段:
- 采用专门的RL训练阶段,培养适用于高级推理和智能体任务的专家模型,例如编码、信息检索和通用工具使用。
- 增强的信息检索问答能力:
- 通过引入人在回路策略和内容混淆技术,强化信息检索类问答表现。
- 技能整合:
- 将通过强化学习和监督学习获得的知识和技能蒸馏到单个鲁棒的专家模型中,在各类任务上表现出全面且强劲的性能。
GLM 4.5最擅长的任务及基准测试

来自Z.AI
智能体任务
GLM 4.5专门针对自主智能体应用优化:
- 原生函数调用能力,无需外部编排
- 网页浏览和多轮工具使用
- 自主任务规划与执行
- 支持与Claude Code、Roo Code、Trae等编码框架集成

编码与软件开发
该模型展现出卓越的编码能力:
- 全栈Web开发(前端、后端、数据库管理)
- 从零生成代码、调试现有项目
- 终端操作和命令行界面任务
- 算法实现与优化
- 真实世界软件工程问题解决

GLM-4.5的编码能力在多种编程任务中与多个领先模型进行了对比评估。测试在受控环境中按照统一标准进行,结果显示GLM-4.5表现稳定且具有竞争力,尤其在工具使用方面,其平均成功率在所有测试模型中排名第一。

来自Z.AI

来自Z.AI
复杂推理
GLM-4.5在复杂推理任务上表现优异:
- 数学问题求解(AIME、MATH基准测试)
- 科学推理与分析
- 逻辑问题求解与多步推理
- 长上下文理解与分析

那么,GLM 4.5适合初学者开发者吗?
1. 开发工具集成
- 与主流工具无缝兼容:支持Claude Code、Roo Code等
- 命令行学习支持:内置终端操作支持
- 数据库支持:可帮助管理全栈项目中的数据库
2. 用自然语言编码
- 自然语言编程:只需描述你想要的功能,GLM即可生成对应代码
- 示例:“创建一个BMI计算网页”——它可以同时生成前端和后端代码
3. 代码解释与错误修复
- 代码解释:GLM会告诉你每一行代码的作用
- 调试帮助:如果出现错误,它会解释问题原因并提供修复方案
如何访问GLM 4.5?
GLM 4.5提供多种访问方式,满足不同用户需求和技术要求:
1. Web界面(最适合初学者)

2. API访问(面向开发者)
Novita AI提供的API支持131K上下文,输入成本为**$0.6/单位**,输出成本为**$2.2/单位**,能够强力支持你最大化发挥GLM 4.5的代码智能体潜力。
Novita AI
步骤1:登录并访问模型库 登录你的账户,点击模型库按钮。

步骤2:选择模型 浏览可用选项,选择适合你需求的模型。

步骤3:开始免费试用 开始免费试用,探索所选模型的能力。

步骤4:获取API密钥 要使用API进行身份验证,我们将为你提供新的API密钥。进入“设置”页面,即可按照图中提示复制API密钥。

步骤5:安装API 使用对应编程语言的包管理器安装API。安装完成后,将必要的库导入到你的开发环境中。使用API密钥初始化API,即可开始与Novita AI LLM交互。以下是Python用户使用聊天补全API的示例。
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="session_UsudmdAIggvSInjIdO2HWaTCyXxTFOXDV8TH8UCPbA576Rs4AGqSA5ThNbelSDgdEGAWQcWXnAU2bHi5BueceA==",
)
model = "zai-org/glm-4.5"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
3. 本地部署(高级用户)
要求:
- GLM-4.5:需要大量GPU资源(可能需要约700B显存)
- GLM-4.5-Air:16GB GPU内存(INT4量化后仅需12GB)
安装步骤:
- 从HuggingFace或ModelScope下载模型权重
- 选择推理框架:支持vLLM或SGLang
- 遵循官方GitHub仓库中的部署指南
4. 集成
使用Trae、Claude Code、Qwen Code等CLI工具
如果你想在本地环境或IDE中使用Novita AI的顶级模型(如Qwen3-Coder、Kimi K2、DeepSeek R1)获得AI编码辅助,流程非常简单:获取API密钥、安装工具、配置环境变量,即可开始编码。
详细的设置命令和示例请查看官方教程:
- Trae:在IDE中访问AI模型的分步指南
- Claude Code:在Windows、Mac和Linux上使用Kimi-K2的指南
- Qwen Code:在Qwen Code中使用OpenAI兼容API的指南(60秒完成设置!)
使用OpenAI Agents SDK构建多智能体工作流
通过将Novita AI与OpenAI Agents SDK集成,构建高级多智能体系统:
- 即插即用: 在任何OpenAI Agents工作流中使用Novita AI的LLM。
- 支持交接、路由和工具使用: 设计能够委托、分流或执行函数的智能体,全部由Novita AI的模型提供支持。
- Python集成: 只需将SDK端点设置为
https://api.novita.ai/v3/openai,并使用你的API密钥即可。
在第三方平台连接API
OpenAI兼容API: 享受无忧迁移和集成,支持Cline和Cursor等专为OpenAI API标准设计的工具。
Hugging Face: 通过Novita AI端点,在Spaces、流水线或Transformers库中使用模型。
智能体与编排框架: 通过官方连接器和分步集成指南,轻松将Novita AI与Continue、AnythingLLM、LangChain、Dify和Langflow等合作伙伴平台连接。
GLM 4.5是智能体应用、编码和复杂推理领域的强大、 versatile AI模型,代表了中国AI生态系统的重大飞跃。从简单的Web界面到API和本地部署,GLM-4.5有多种访问选项,适合从初学者到高级开发者的所有人群。其强大的性能和灵活的集成能力,使其成为构建智能自主解决方案的绝佳选择。
常见问题
谁应该使用GLM 4.5? GLM-4.5非常适合寻求高级AI智能体能力的开发者、研究人员和企业,尤其适用于编码、自动化和知识类任务。
本地运行GLM 4.5的硬件要求是什么? 旗舰模型需要大量GPU资源,而Air版本在INT4量化后仅需12GB显存即可运行。
初学者如何试用GLM 4.5? 只需使用Web界面——无需安装或编码经验。
Novita AI是一个AI云平台,为开发者提供简单的API来部署AI模型,同时提供高性价比且可靠的GPU云,用于构建和扩展AI应用。
