GPT-OSS-120B 与 GLM-4.5 对比:实用派还是系统派?

GPT-OSS-120B 与 GLM-4.5 对比:实用派还是系统派?

核心亮点

GPT-OSS-120B:OpenAI 推出的 117B 参数开源权重 MoE 模型,专为企业级推理和生产部署设计,性能接近 o4-mini。

GLM-4.5:统一推理、编程和智能体能力的基础模型,可满足智能体应用的复杂需求。

Novita AI 不仅提供稳定的 API 服务,还拥有极具性价比的定价。例如,GPT-OSS-120B 每 100 万输入 token 收费 0.1 美元,每 100 万输出 token 收费 0.5 美元;而 GLM-4.5 每 100 万输入 token 收费 0.6 美元,每 100 万输出 token 收费 2.2 美元。

模型基础介绍

GPT-OSS-120B

gpt-oss-120B 是 OpenAI 开发的开源权重混合专家(MoE)语言模型,聚焦强大的推理能力、智能体应用和可扩展部署。该模型专为高性能企业级和开发者场景打造,在核心推理基准测试中性能接近 OpenAI 的 o4-mini 模型,同时具备高性价比和易用性。

  • 参数: 总参数量 1170 亿,单步推理激活参数量 51 亿。
  • 架构: 混合专家设计,共 36 层、128 个专家,采用 SwiGLU 激活函数。高效的专家路由系统仅会为每个 token 激活最相关的专家子集,实现更高的专业性和效率。具备每个注意力头独立学习的注意力 sink 机制,可提升性能。
  • 上下文窗口: 支持 128K token 的上下文窗口,可支持长文本推理、多轮对话,以及处理长文档或大型代码库。
  • 智能体能力: 原生支持函数调用、网页浏览、Python 代码执行和结构化输出,适合构建智能体应用。兼容 OpenAI 响应 API 格式,支持针对自定义场景微调。

GLM-4.5

GLM-4.5 是为智能体设计的基础模型,总参数量 3550 亿,激活参数量 320 亿。该模型统一了推理、编程和智能体能力,可满足智能体应用的复杂需求。GLM-4.5 是混合推理模型,提供两种模式:面向复杂推理和工具调用的思考模式,以及面向即时响应的非思考模式。

核心特性与架构

  • 参数: 总参数量 3550 亿,单步推理激活参数量 320 亿。
  • 混合推理: 两种运行模式 - 面向复杂推理和工具调用的思考模式,以及面向即时响应的非思考模式。
  • 模型版本: 提供基础模型、混合推理模型和 FP8 版本。
  • 上下文窗口: 128K token。
  • 开源许可: 采用 MIT 开源许可,支持商业使用和二次开发。
  • 能力: 统一推理、编程和智能体功能,可支撑复杂应用场景。

GPT-OSS-120B 与 GLM-4.5 基准测试对比

1. 智能基准测试

2. 上下文窗口:

GPT OSS 120B: 128K token

GLM-4.5: 128K token

3. API 定价:

GPT OSS 120B: 每 100 万 token 输入 0.1 美元 / 输出 0.5 美元

GLM-4.5: 每 100 万 token 输入 0.6 美元 / 输出 2.2 美元

GPT-OSS-120B 与 GLM-4.5 应用技能测试

1. GPT-OSS-120BGLM-4.5 对比:谁更适合代码生成?

任务描述: 实现一个名为 SmartQueue 的 Python 类,需具备以下功能:

  1. 支持优先队列操作(数值越小优先级越高)
  2. 支持批量操作(一次性添加/删除多个元素)
  3. 实现智能的 auto_process() 方法,可自动处理优先级最高的前 N 个任务
  4. 包含基础统计功能(已处理总数、当前队列大小)

具体要求:

# 预期使用示例:
queue = SmartQueue()
queue.add_task("task1", priority=2)
queue.add_batch([("task2", 1), ("task3", 3), ("task4", 1)])
print(queue.get_stats())  # 返回统计字典
processed = queue.auto_process(count=2)  # 处理优先级最高的 2 个任务
print(processed)  # 返回已处理任务列表

评估维度:

  • 数据结构选择: 是否选用了合适的数据结构(如 heapq)
  • API 设计: 方法名和参数设计是否合理
  • 异常处理: 是否处理了边界情况(空队列、无效参数等)
  • 代码组织: 类结构和方法的实现逻辑是否清晰
  • Python 惯用写法: 是否使用了 Python 特有的特性和规范
  • 算法效率: 是否考虑了操作的时间复杂度

额外挑战: auto_process() 方法需以有意义的格式返回已处理的任务,并更新内部统计数据。

GPT-OSS-120B

GPT OSS 120B 编程挑战

GLM 4.5

GLM4.5 编程挑战

GLM 4.5:适合学习和简单原型开发,生产环境使用需进一步优化

GPT OSS 120B:可直接用于专业项目,符合工业级代码质量标准

立即体验 GPT-OSS-120B 和 GLM-4.5!

2. 对比 GPT-OSS-120B,GLM-4.5 如何处理歧义查询?

Prompt: “银行打来电话说支票的事,钱不够。”

这句话包含多重歧义,请完成以下任务:

  1. 识别这句话所有可能的解读
  2. 按现代语境下的可能性对解读进行排序
  3. 说明你消歧的推理过程
  4. 如果需要额外信息才能确定含义,你会提出哪些具体问题?
  5. 假设你在帮他人理解大概率发生了什么,给出对应的回复

请明确说明你的思考过程和任何假设。

GPT-OSS-120B

gpt oss 120b 歧义查询处理

GLM 4.5

GLM 4.5 歧义查询处理

GPT-OSS-120B 展现了更深入的分析能力和系统性推理,而 GLM-4.5 在兼顾全面性和可用性方面表现出更好的实用判断。GPT-OSS-120B 擅长穷尽式消歧,而 GLM-4.5 优先保证回复清晰度和可操作性。

如何在 Novita AI 上使用 GPT-OSS-120BGLM-4.5

步骤 1:登录并进入模型库

登录你的账号,点击 模型库 按钮。

Model Library

立即体验 GPT-OSS-120B 和 GLM-4.5!

步骤 2:选择你需要的模型

浏览可用选项,选择适合你需求的模型。

Choose Your Model

步骤 3:开启免费试用

开始免费试用,探索所选模型的能力。

choose your model

步骤 4:获取 API 密钥

为了通过 API 完成身份验证,我们会为你提供新的 API 密钥。进入「设置」页面,即可按照下图提示复制 API 密钥。

get api key

步骤 5:安装 API 客户端

使用你所用编程语言的包管理器安装 API 客户端。

install api

安装完成后,将所需的库导入到你的开发环境中。使用 API 密钥初始化 API,即可开始调用 Novita AI 的大语言模型。以下是 Python 用户使用聊天补全 API 的示例:

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "zai-org/glm-4.5"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

GPT-OSS-120B 是出色的生产级解决方案,具备全面的分析深度和系统性推理能力,符合工业级代码质量标准。它穷尽式的问题解决方式适合需要详细文档和严格分析的专业项目。

GLM-4.5 是优秀的开发和原型工具,提供实用的、以用户为中心的响应,推理流程更简洁。它在全面性和可用性之间取得了平衡,非常适合学习场景和快速原型开发。

常见问题

什么是 GPT-OSS-120B?

GPT-OSS-120B 是 OpenAI 推出的 117B 参数开源权重 MoE 模型,专为企业级推理和生产部署设计,性能接近 o4-mini。

如何使用 GLM 模型?

GLM 模型可以通过 Novita AI 等平台的官方 API 部署,具体设置说明因模型版本和硬件要求而异。

GPT-4o 是开源的吗?

不是,但 GPT-OSS-120B 是开源模型,性能与 GPT-4o 相当,可在 Novita AI 上使用。

关于 Novita AI
Novita AI 是一个 AI 云平台,为开发者提供简单的 API 来部署 AI 模型,同时提供高性价比、可靠的 GPU 云服务,用于模型构建和扩展。