GPT-OSS-120B 与 GLM-4.5 对比：实用派还是系统派？

模型基础介绍
GPT-OSS-120B 与 GLM-4.5 基准测试对比
GPT-OSS-120B 与 GLM-4.5 应用技能测试
如何在 Novita AI 上使用 GPT-OSS-120B 和 GLM-4.5
常见问题

核心亮点

GPT-OSS-120B：OpenAI 推出的 117B 参数开源权重 MoE 模型，专为企业级推理和生产部署设计，性能接近 o4-mini。

GLM-4.5：统一推理、编程和智能体能力的基础模型，可满足智能体应用的复杂需求。

Novita AI 不仅提供稳定的 API 服务，还拥有极具性价比的定价。例如，GPT-OSS-120B 每 100 万输入 token 收费 0.1 美元，每 100 万输出 token 收费 0.5 美元；而 GLM-4.5 每 100 万输入 token 收费 0.6 美元，每 100 万输出 token 收费 2.2 美元。

模型基础介绍

GPT-OSS-120B

gpt-oss-120B 是 OpenAI 开发的开源权重混合专家（MoE）语言模型，聚焦强大的推理能力、智能体应用和可扩展部署。该模型专为高性能企业级和开发者场景打造，在核心推理基准测试中性能接近 OpenAI 的 o4-mini 模型，同时具备高性价比和易用性。

参数： 总参数量 1170 亿，单步推理激活参数量 51 亿。
架构： 混合专家设计，共 36 层、128 个专家，采用 SwiGLU 激活函数。高效的专家路由系统仅会为每个 token 激活最相关的专家子集，实现更高的专业性和效率。具备每个注意力头独立学习的注意力 sink 机制，可提升性能。
上下文窗口： 支持 128K token 的上下文窗口，可支持长文本推理、多轮对话，以及处理长文档或大型代码库。
智能体能力： 原生支持函数调用、网页浏览、Python 代码执行和结构化输出，适合构建智能体应用。兼容 OpenAI 响应 API 格式，支持针对自定义场景微调。

GLM-4.5

GLM-4.5 是为智能体设计的基础模型，总参数量 3550 亿，激活参数量 320 亿。该模型统一了推理、编程和智能体能力，可满足智能体应用的复杂需求。GLM-4.5 是混合推理模型，提供两种模式：面向复杂推理和工具调用的思考模式，以及面向即时响应的非思考模式。

核心特性与架构

参数： 总参数量 3550 亿，单步推理激活参数量 320 亿。
混合推理： 两种运行模式 - 面向复杂推理和工具调用的思考模式，以及面向即时响应的非思考模式。
模型版本： 提供基础模型、混合推理模型和 FP8 版本。
上下文窗口： 128K token。
开源许可： 采用 MIT 开源许可，支持商业使用和二次开发。
能力： 统一推理、编程和智能体功能，可支撑复杂应用场景。

GPT-OSS-120B 与 GLM-4.5 基准测试对比

1. 智能基准测试

2. 上下文窗口：

GPT OSS 120B： 128K token

GLM-4.5： 128K token

3. API 定价：

GPT OSS 120B： 每 100 万 token 输入 0.1 美元 / 输出 0.5 美元

GLM-4.5： 每 100 万 token 输入 0.6 美元 / 输出 2.2 美元

GPT-OSS-120B 与 GLM-4.5 应用技能测试

1. GPT-OSS-120B 与 GLM-4.5 对比：谁更适合代码生成？

任务描述： 实现一个名为 SmartQueue 的 Python 类，需具备以下功能：

支持优先队列操作（数值越小优先级越高）
支持批量操作（一次性添加/删除多个元素）
实现智能的 auto_process() 方法，可自动处理优先级最高的前 N 个任务
包含基础统计功能（已处理总数、当前队列大小）

具体要求：

# 预期使用示例：
queue = SmartQueue()
queue.add_task("task1", priority=2)
queue.add_batch([("task2", 1), ("task3", 3), ("task4", 1)])
print(queue.get_stats())  # 返回统计字典
processed = queue.auto_process(count=2)  # 处理优先级最高的 2 个任务
print(processed)  # 返回已处理任务列表

评估维度：

数据结构选择： 是否选用了合适的数据结构（如 heapq）
API 设计： 方法名和参数设计是否合理
异常处理： 是否处理了边界情况（空队列、无效参数等）
代码组织： 类结构和方法的实现逻辑是否清晰
Python 惯用写法： 是否使用了 Python 特有的特性和规范
算法效率： 是否考虑了操作的时间复杂度

额外挑战： auto_process() 方法需以有意义的格式返回已处理的任务，并更新内部统计数据。

GPT-OSS-120B

GLM 4.5

GLM 4.5：适合学习和简单原型开发，生产环境使用需进一步优化

GPT OSS 120B：可直接用于专业项目，符合工业级代码质量标准

立即体验 GPT-OSS-120B 和 GLM-4.5！

2. 对比 GPT-OSS-120B，GLM-4.5 如何处理歧义查询？

Prompt： “银行打来电话说支票的事，钱不够。”

这句话包含多重歧义，请完成以下任务：

识别这句话所有可能的解读
按现代语境下的可能性对解读进行排序
说明你消歧的推理过程
如果需要额外信息才能确定含义，你会提出哪些具体问题？
假设你在帮他人理解大概率发生了什么，给出对应的回复

请明确说明你的思考过程和任何假设。

GPT-OSS-120B

GLM 4.5

GPT-OSS-120B 展现了更深入的分析能力和系统性推理，而 GLM-4.5 在兼顾全面性和可用性方面表现出更好的实用判断。GPT-OSS-120B 擅长穷尽式消歧，而 GLM-4.5 优先保证回复清晰度和可操作性。

如何在 Novita AI 上使用 GPT-OSS-120B 和 GLM-4.5

步骤 1：登录并进入模型库

登录你的账号，点击 模型库 按钮。

立即体验 GPT-OSS-120B 和 GLM-4.5！

步骤 2：选择你需要的模型

浏览可用选项，选择适合你需求的模型。

步骤 3：开启免费试用

开始免费试用，探索所选模型的能力。

步骤 4：获取 API 密钥

为了通过 API 完成身份验证，我们会为你提供新的 API 密钥。进入「设置」页面，即可按照下图提示复制 API 密钥。

步骤 5：安装 API 客户端

使用你所用编程语言的包管理器安装 API 客户端。

安装完成后，将所需的库导入到你的开发环境中。使用 API 密钥初始化 API，即可开始调用 Novita AI 的大语言模型。以下是 Python 用户使用聊天补全 API 的示例：

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "zai-org/glm-4.5"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

GPT-OSS-120B 是出色的生产级解决方案，具备全面的分析深度和系统性推理能力，符合工业级代码质量标准。它穷尽式的问题解决方式适合需要详细文档和严格分析的专业项目。

GLM-4.5 是优秀的开发和原型工具，提供实用的、以用户为中心的响应，推理流程更简洁。它在全面性和可用性之间取得了平衡，非常适合学习场景和快速原型开发。

常见问题

什么是 GPT-OSS-120B？

GPT-OSS-120B 是 OpenAI 推出的 117B 参数开源权重 MoE 模型，专为企业级推理和生产部署设计，性能接近 o4-mini。

如何使用 GLM 模型？

GLM 模型可以通过 Novita AI 等平台的官方 API 部署，具体设置说明因模型版本和硬件要求而异。

GPT-4o 是开源的吗？

不是，但 GPT-OSS-120B 是开源模型，性能与 GPT-4o 相当，可在 Novita AI 上使用。

关于 Novita AI
Novita AI 是一个 AI 云平台，为开发者提供简单的 API 来部署 AI 模型，同时提供高性价比、可靠的 GPU 云服务，用于模型构建和扩展。

GPT-OSS-120B 与 GLM-4.5 对比：实用派还是系统派？

核心亮点

模型基础介绍

GPT-OSS-120B

GLM-4.5

核心特性与架构

GPT-OSS-120B 与 GLM-4.5 基准测试对比

1. 智能基准测试

2. 上下文窗口：

3. API 定价：

GPT-OSS-120B 与 GLM-4.5 应用技能测试

1. GPT-OSS-120B 与 GLM-4.5 对比：谁更适合代码生成？

GPT-OSS-120B

GLM 4.5

2. 对比 GPT-OSS-120B，GLM-4.5 如何处理歧义查询？

GPT-OSS-120B

GLM 4.5

如何在 Novita AI 上使用 GPT-OSS-120B 和 GLM-4.5

步骤 1：登录并进入模型库

步骤 2：选择你需要的模型

步骤 3：开启免费试用

步骤 4：获取 API 密钥

步骤 5：安装 API 客户端

常见问题

Product

RESOURCES

Partners

Company

核心亮点

模型基础介绍

核心特性与架构

GPT-OSS-120B 与 GLM-4.5 基准测试对比

1. 智能基准测试

2. 上下文窗口：

3. API 定价：

GPT-OSS-120B 与 GLM-4.5 应用技能测试

1. GPT-OSS-120B 与 GLM-4.5 对比：谁更适合代码生成？

2. 对比 GPT-OSS-120B，GLM-4.5 如何处理歧义查询？

如何在 Novita AI 上使用 GPT-OSS-120B 和 GLM-4.5

步骤 1：登录并进入模型库

步骤 2：选择你需要的模型

步骤 3：开启免费试用

步骤 4：获取 API 密钥

步骤 5：安装 API 客户端

常见问题

相关文章

Product

RESOURCES

Partners

Company