Key Hightlights
GPT-OSS-120B:由 OpenAI 開發的 1170 億參數開放權重 MoE 模型,專為企業級推理與生產部署設計,效能接近 o4-mini。
GLM-4.5:統一推理、編程與智慧代理能力的基礎模型,滿足智慧代理應用的複雜需求。
Novita AI 不僅提供穩定的 API 服務,還定價非常實惠。例如,GPT-OSS-120B 輸入計費為每百萬 Token 0.1 美元、輸出為每百萬 Token 0.5 美元;而 GLM-4.5 輸入計費為每百萬 Token 0.6 美元、輸出為每百萬 Token 2.2 美元。
模型基礎介紹
GPT-OSS-120B
gpt-oss-120B 是由 OpenAI 開發的開放權重混合專家(MoE)語言模型,專注於強大的推理能力、代理應用與可擴展部署。它專為高效能企業與開發者使用場景設計,在核心推理基準上達到與 OpenAI o4-mini 模型近乎持平的水準,同時兼具成本效益與易用性。
- 參數規模:總參數 1170 億,每次推理步驟僅激活 51 億參數。
- 架構:採用混合專家設計,共 36 層、128 位專家,使用 SwiGLU 激活函數。高效的專家路由系統會為每個 Token 僅激活最相關的專家子集,提升專業度與效率。每個注意力頭配備學習型注意力匯(attention sinks),優化效能表現。
- 上下文視窗:支援 128K Token 的上下文長度,可實現長篇推理、多輪對話,以及處理大型文件或程式碼庫。
- 代理能力:原生支援函數呼叫、網頁瀏覽、Python 程式碼執行與結構化輸出,適合構建智慧代理。相容 OpenAI 回應 API 格式,且支援針對自訂場景進行微調。
GLM-4.5
GLM-4.5 是專為智慧代理設計的基礎模型,總參數 3550 億,激活參數 320 億。該模型統一推理、編程與智慧代理能力,滿足智慧代理應用的複雜需求。GLM-4.5 是混合推理模型,提供兩種模式:用於複雜推理與工具調用的思考模式,以及用於即時回應的非思考模式。
關鍵特性與架構
- 參數規模:總參數 3550 億,每次推理激活 320 億參數。
- 混合推理:兩種運行模式——思考模式用於複雜推理與工具調用,非思考模式用於即時回應。
- 模型版本:提供基礎模型、混合推理模型與 FP8 版本。
- 上下文視窗:128K Token。
- 授權協議:採用 MIT 開源授權,支援商業使用與二次開發。
- 能力:統一推理、編程與智慧代理功能,適用於複雜應用場景。
GPT-OSS-120B 與 GLM-4.5 基準測試對比
1. 智慧能力基準

2. 上下文視窗:
GPT OSS 120B: 128K Tokens
GLM-4.5: 128K Tokens
3. API 定價:
GPT OSS 120B: $0.1 / $0.5 每百萬 Token 輸入/輸出
GLM-4.5: $0.6 / $2.2 每百萬 Token 輸入/輸出
GPT-OSS-120B 與 GLM-4.5 實用技能測試
1. GPT-OSS-120B 對比 GLM-4.5:哪個更適合程式碼生成?
任務描述: 實現一個 Python 類 SmartQueue,需包含以下功能:
- 支援優先佇列操作(數字越小優先級越高)
- 支援批量操作(一次新增/移除多個元素)
- 實現智慧
auto_process()方法,可自動處理優先級最高的前 N 個項目 - 包含基礎統計追蹤功能(已處理總數、當前佇列大小)
具體要求:
# 預期使用範例:
queue = SmartQueue()
queue.add_task("task1", priority=2)
queue.add_batch([("task2", 1), ("task3", 3), ("task4", 1)])
print(queue.get_stats()) # 返回統計字典
processed = queue.auto_process(count=2) # 處理優先級最高的 2 個任務
print(processed) # 返回已處理任務列表
評維維度:
- 資料結構選擇:是否選用合適的資料結構(例如 heapq)
- API 設計:方法命名與參數設計是否合理
- 錯誤處理:是否處理邊界情況(空佇列、無效參數等)
- 程式碼組織:類結構與方法實現邏輯
- Python 慣用寫法:是否使用 Python 專屬特性與慣例
- 算法效率:操作的時間複雜度考量
額外挑戰:auto_process() 方法需以有意義的格式返回處理過的項目,並更新內部統計數據。
GPT-OSS-120B

GLM 4.5

GLM 4.5:適合學習與簡單原型開發,生產環境使用需進一步優化
GPT OSS 120B:可直接用於專業項目,符合工業級程式碼品質標準
2. 相比 GPT-OSS-120B,GLM-4.5 如何處理模糊查詢?
Prompt: “The bank called about the check. It was insufficient.”
這句話包含多種歧義。請你:
- 列出這句話所有可能的解釋
- 按照現代語境下的可能性對這些解釋排序
- 說明你消除歧義的推理過程
- 如果需要額外語境才能確定,你會提出什麼具體問題?
- 請以協助他人理解最可能發生的情況為前提給出回應 請明確說明你的思考過程與任何假設。
GPT-OSS-120B

GLM 4.5

GPT-OSS-120B 展現了更深入的系統性分析與推理能力,而 GLM-4.5 在兼備詳細度與實用性方面表現更優。 GPT-OSS-120B 擅長窮盡式歧義消除,GLM-4.5 則優先兼顧清晰度與可操作的回應。
如何在 Novita AI 上使用 GPT-OSS-120B 與 GLM-4.5
步驟 1:登入並進入模型庫
登入你的帳號,點擊 模型庫 按鈕。

步驟 2:選擇你需要的模型
瀏覽可用選項,選擇符合你需求的模型。

步驟 3:開始免費試用
開始免費試用,探索所選模型的能力。

步驟 4:獲取 API 金鑰
要進行 API 認證,我們會為你提供新的 API 金鑰。進入「設定」頁面,即可按照圖中指示複製 API 金鑰。

步驟 5:安裝 API
使用對應程式語言的套件管理器安裝 API。

安裝完成後,將必要的庫導入你的開發環境,使用 API 金鑰初始化 API 即可開始與 Novita AI LLM 互動。以下是用於 Python 使用者的聊天補全 API 範例:
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="",
)
model = "zai-org/glm-4.5"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
GPT-OSS-120B 作為生產就緒方案脫穎而出,提供全面的分析深度與系統性推理能力,符合工業級程式碼品質標準。其窮盡式問題解決方法適合需要詳細文件與嚴格分析的专业項目。
GLM-4.5 作為開發與原型工具表現優異,提供實用、以使用者為核心的回應,搭配精簡的推理流程。它平衡了詳細度與實用性,非常適合學習環境與快速原型開發。
常見問題
什麼是 GPT-OSS-120B? GPT-OSS-120B 是由 OpenAI 開發的 1170 億參數開放權重 MoE 模型,專為企業級推理與生產部署設計,效能接近 o4-mini。
如何訓練 GLM 模型? GLM 模型可透過 Novita AI 等平台的官方 API 部署,具體設定步驟因模型版本與硬體需求而異。
GPT-4o 是開源的嗎? 不是,但 GPT-OSS-120B 是開源模型,效能與 GPT-4o 相當,可在 Novita AI 上使用。
關於 Novita AI
Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 介面部署 AI 模型,同時也提供實惠且可靠的 GPU 雲端服務,用於構建與擴展 AI 應用。
