GPT-OSS-120B 對比 GLM-4.5:實用導向還是系統性導向?

GPT-OSS-120B 對比 GLM-4.5:實用導向還是系統性導向?

Key Hightlights

GPT-OSS-120B:由 OpenAI 開發的 1170 億參數開放權重 MoE 模型,專為企業級推理與生產部署設計,效能接近 o4-mini。

GLM-4.5:統一推理、編程與智慧代理能力的基礎模型,滿足智慧代理應用的複雜需求。

Novita AI 不僅提供穩定的 API 服務,還定價非常實惠。例如,GPT-OSS-120B 輸入計費為每百萬 Token 0.1 美元、輸出為每百萬 Token 0.5 美元;而 GLM-4.5 輸入計費為每百萬 Token 0.6 美元、輸出為每百萬 Token 2.2 美元。

模型基礎介紹

GPT-OSS-120B

gpt-oss-120B 是由 OpenAI 開發的開放權重混合專家(MoE)語言模型,專注於強大的推理能力、代理應用與可擴展部署。它專為高效能企業與開發者使用場景設計,在核心推理基準上達到與 OpenAI o4-mini 模型近乎持平的水準,同時兼具成本效益與易用性。

  • 參數規模:總參數 1170 億,每次推理步驟僅激活 51 億參數。
  • 架構:採用混合專家設計,共 36 層、128 位專家,使用 SwiGLU 激活函數。高效的專家路由系統會為每個 Token 僅激活最相關的專家子集,提升專業度與效率。每個注意力頭配備學習型注意力匯(attention sinks),優化效能表現。
  • 上下文視窗:支援 128K Token 的上下文長度,可實現長篇推理、多輪對話,以及處理大型文件或程式碼庫。
  • 代理能力:原生支援函數呼叫、網頁瀏覽、Python 程式碼執行與結構化輸出,適合構建智慧代理。相容 OpenAI 回應 API 格式,且支援針對自訂場景進行微調。

GLM-4.5

GLM-4.5 是專為智慧代理設計的基礎模型,總參數 3550 億,激活參數 320 億。該模型統一推理、編程與智慧代理能力,滿足智慧代理應用的複雜需求。GLM-4.5 是混合推理模型,提供兩種模式:用於複雜推理與工具調用的思考模式,以及用於即時回應的非思考模式。

關鍵特性與架構

  • 參數規模:總參數 3550 億,每次推理激活 320 億參數。
  • 混合推理:兩種運行模式——思考模式用於複雜推理與工具調用,非思考模式用於即時回應。
  • 模型版本:提供基礎模型、混合推理模型與 FP8 版本。
  • 上下文視窗:128K Token。
  • 授權協議:採用 MIT 開源授權,支援商業使用與二次開發。
  • 能力:統一推理、編程與智慧代理功能,適用於複雜應用場景。

GPT-OSS-120B 與 GLM-4.5 基準測試對比

1. 智慧能力基準

2. 上下文視窗:

GPT OSS 120B: 128K Tokens

GLM-4.5: 128K Tokens

3. API 定價:

GPT OSS 120B: $0.1 / $0.5 每百萬 Token 輸入/輸出

GLM-4.5: $0.6 / $2.2 每百萬 Token 輸入/輸出

GPT-OSS-120B 與 GLM-4.5 實用技能測試

1. GPT-OSS-120B 對比 GLM-4.5:哪個更適合程式碼生成?

任務描述: 實現一個 Python 類 SmartQueue,需包含以下功能:

  1. 支援優先佇列操作(數字越小優先級越高)
  2. 支援批量操作(一次新增/移除多個元素)
  3. 實現智慧 auto_process() 方法,可自動處理優先級最高的前 N 個項目
  4. 包含基礎統計追蹤功能(已處理總數、當前佇列大小)

具體要求:

# 預期使用範例:
queue = SmartQueue()
queue.add_task("task1", priority=2)
queue.add_batch([("task2", 1), ("task3", 3), ("task4", 1)])
print(queue.get_stats())  # 返回統計字典
processed = queue.auto_process(count=2)  # 處理優先級最高的 2 個任務
print(processed)  # 返回已處理任務列表

評維維度:

  • 資料結構選擇:是否選用合適的資料結構(例如 heapq)
  • API 設計:方法命名與參數設計是否合理
  • 錯誤處理:是否處理邊界情況(空佇列、無效參數等)
  • 程式碼組織:類結構與方法實現邏輯
  • Python 慣用寫法:是否使用 Python 專屬特性與慣例
  • 算法效率:操作的時間複雜度考量

額外挑戰auto_process() 方法需以有意義的格式返回處理過的項目,並更新內部統計數據。

GPT-OSS-120B

GPT OSS 120B 程式碼挑戰

GLM 4.5

GLM4.5 程式碼挑戰

GLM 4.5:適合學習與簡單原型開發,生產環境使用需進一步優化

GPT OSS 120B:可直接用於專業項目,符合工業級程式碼品質標準

親自試用 GPT-OSS-120B 與 GLM-4.5!

2. 相比 GPT-OSS-120B,GLM-4.5 如何處理模糊查詢?

Prompt: “The bank called about the check. It was insufficient.”

這句話包含多種歧義。請你:

  1. 列出這句話所有可能的解釋
  2. 按照現代語境下的可能性對這些解釋排序
  3. 說明你消除歧義的推理過程
  4. 如果需要額外語境才能確定,你會提出什麼具體問題?
  5. 請以協助他人理解最可能發生的情況為前提給出回應 請明確說明你的思考過程與任何假設。

GPT-OSS-120B

GPT OSS 120B 模糊查詢處理結果

GLM 4.5

GLM 4.5 模糊查詢處理結果

GPT-OSS-120B 展現了更深入的系統性分析與推理能力,而 GLM-4.5 在兼備詳細度與實用性方面表現更優。 GPT-OSS-120B 擅長窮盡式歧義消除,GLM-4.5 則優先兼顧清晰度與可操作的回應。

如何在 Novita AI 上使用 GPT-OSS-120BGLM-4.5

步驟 1:登入並進入模型庫

登入你的帳號,點擊 模型庫 按鈕。 模型庫

立即試用 GPT-OSS-120B 與 GLM-4.5!

步驟 2:選擇你需要的模型

瀏覽可用選項,選擇符合你需求的模型。 選擇模型

步驟 3:開始免費試用

開始免費試用,探索所選模型的能力。 選擇模型

步驟 4:獲取 API 金鑰

要進行 API 認證,我們會為你提供新的 API 金鑰。進入「設定」頁面,即可按照圖中指示複製 API 金鑰。 獲取 API 金鑰

步驟 5:安裝 API

使用對應程式語言的套件管理器安裝 API。 安裝 API

安裝完成後,將必要的庫導入你的開發環境,使用 API 金鑰初始化 API 即可開始與 Novita AI LLM 互動。以下是用於 Python 使用者的聊天補全 API 範例:

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "zai-org/glm-4.5"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

GPT-OSS-120B 作為生產就緒方案脫穎而出,提供全面的分析深度與系統性推理能力,符合工業級程式碼品質標準。其窮盡式問題解決方法適合需要詳細文件與嚴格分析的专业項目。

GLM-4.5 作為開發與原型工具表現優異,提供實用、以使用者為核心的回應,搭配精簡的推理流程。它平衡了詳細度與實用性,非常適合學習環境與快速原型開發。

常見問題

什麼是 GPT-OSS-120B? GPT-OSS-120B 是由 OpenAI 開發的 1170 億參數開放權重 MoE 模型,專為企業級推理與生產部署設計,效能接近 o4-mini。

如何訓練 GLM 模型? GLM 模型可透過 Novita AI 等平台的官方 API 部署,具體設定步驟因模型版本與硬體需求而異。

GPT-4o 是開源的嗎? 不是,但 GPT-OSS-120B 是開源模型,效能與 GPT-4o 相當,可在 Novita AI 上使用。

關於 Novita AI
Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 介面部署 AI 模型,同時也提供實惠且可靠的 GPU 雲端服務,用於構建與擴展 AI 應用。