Qwen3-235B-A22B-Instruct-2507 現已於 Novita AI 上架

什麼是 Qwen3-235B-A22B-Instruct-2507？
效能基準
如何在 Novita AI 上存取 Qwen3-235B-A22B-Instruct-2507
達到最佳效能的實務指南
結論

阿里巴巴革命性的 Qwen3-235B-A22B-Instruct-2507 現已於 Novita AI 上線。

憑藉媲美甚至超越 GPT-4o、Claude Opus 及其他業界領先模型的基準評分，Qwen3-235B-A22B-Instruct-2507 以極低的成本提供企業級效能。無論您是打造次世代聊天機器人、複雜推理系統，還是多語言應用程式，此模型重新定義了生產環境中可實現的目標。

Novita AI 目前定價：輸入 tokens 每 M 單位 $0.15 美元，輸出 tokens 每 M 單位 $0.8 美元

體驗 Qwen3-235B-A22B-Instruct-2507 展示

什麼是 Qwen3-235B-A22B-Instruct-2507？

Qwen3-235B-A22B-Instruct-2507 是阿里巴巴旗艦 235B 參數模型的增強版本，在指令遵循、數學推理、編碼能力和使用者對齊方面有顯著改進。該模型基於基礎 Qwen3-235B-A22B 架構，並通過針對性優化在關鍵基準測試中實現了可衡量的效能提升。

突破性增強

革命性的能力提升：在指令遵循、邏輯推理、文字理解、數學、科學、編碼和工具使用方面體驗大幅躍進，超越最先進的商業模型。

前所未有的知識掌握：在多語言的長尾知識覆蓋方面取得巨大進展，實現了以前開源模型無法達到的應用。

完美的使用者對齊：在主觀和開放式任務中與使用者偏好完美對齊，提供自然且上下文完美的回應。

擴展上下文掌握：革命性的 256K 長上下文理解，可在整個文件、研究論文和長時間對話中保持完美的連貫性。

技術卓越性

類型：因果語言模型
訓練階段：預訓練與後期訓練
總參數量：235B，其中 22B 被啟用
非嵌入參數：234B
架構：94 層
注意力頭 (GQA)：Q 為 64，KV 為 4
專家數：總共 128 個專家，8 個專家被啟用
上下文長度：原生支援 262,144 tokens
模式：僅非思考模式（不會產生 thinking response 區塊）

效能基準

Qwen3-235B-A22B-Instruct-2507 不僅能與業界領導者競爭，更能超越它們。在全面的評估基準中，此模型始終優於 GPT-4o、Claude Opus 4、Deepseek-V3 及其他高階模型，而且經常大幅領先。

全面效能結果

關鍵效能亮點

數學卓越性：在 AIME25 上達到驚人的 70.3%，在 HMMT25 上達到 55.4%，展現了無與倫比的數學推理能力，顯著超越所有競爭對手。

邏輯推理精通：在 ZebraLogic 上以傑出的 95.0% 展示近乎完美的邏輯演繹能力，而在 ARC-AGI 上的 41.8% 則證明了強大的抽象推理能力。

優越的知識理解能力：在知識基準測試中表現領先，包括 GPQA 的 77.5% 和 SimpleQA 的 54.3%，為事實準確性樹立了新標準。

編碼領導地位：在 LiveCodeBench v6（51.8%）上表現最佳，在 MultiPL-E（87.9%）上也有強勁表現，確認了其在多種程式語言中卓越的程式設計能力。

使用者偏好對齊：在 Arena-Hard v2 上達到 79.2%，展現了與人類偏好和期望的優異對齊。

多語言卓越性：在所有多語言基準測試中表現強勁，MultiIF 為 77.5%，PolyMATH 為 50.2%，展現了真正的全球語言能力。

如何在 Novita AI 上存取 Qwen3-235B-A22B-Instruct-2507

在 Novita AI 上開始使用 Qwen3-235B-A22B-Instruct-2507 非常簡單，專為需要可靠高效能語言模型存取的開發者和研究人員設計。

使用 Playground（無需編碼）

即時存取：註冊後即可在幾秒內開始體驗 Qwen3-235B-A22B-Instruct-2507 以及其他頂級模型。

互動式介面：透過我們直觀的 Playground 測試複雜提示詞、評估推理能力並即時視覺化結果。

模型比較：輕鬆比較 Qwen3-235B-A22B-Instruct-2507 與其他領先模型，為您的特定使用案例找到完美的解決方案。

透過 API 整合（適用於開發者）

使用 Novita AI 的統一 REST API 將 Qwen3-235B-A22B-Instruct-2507 連接到您的應用程式。無需管理基礎設施，只需專注於打造出色的產品。

選項 1：直接 API 整合（Python 範例）

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "qwen/qwen3-235b-a22b-instruct-2507"
stream = True # or False
max_tokens = 131072
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

主要特色：

與 OpenAI 相容的 API：與現有的 OpenAI 工作流程無縫整合
靈活的參數控制：透過全面的參數選項微調模型行為
串流支援：選擇即時串流或批次回應

選項 2：使用 OpenAI Agents SDK 建立多代理工作流程

使用 Qwen3-235B-A22B-Instruct-2507 建立複雜的多代理系統：

即插即用整合：在任何 OpenAI Agents 工作流程中使用 Novita AI 的模型
進階代理能力：支援交接、路由和工具整合
可擴展架構：設計可委派任務並執行複雜功能的代理

與第三方平台連接

開發工具：透過與 OpenAI 相容的 API，無縫整合熱門的 IDE 和開發環境，例如 Cursor、Continue、Trae 和 Cline。

編排框架：使用官方連接器與 LangChain、Dify、Langflow 和其他 AI 編排平台連接。

Hugging Face 整合：透過 Novita AI 端點，在 Spaces、pipelines 或使用 Transformers 函式庫時使用 Qwen3-235B-A22B-Instruct-2507。

達到最佳效能的實務指南

根據 Qwen 團隊的官方建議，請遵循以下指南以在 Qwen3-235B-A22B-Instruct-2507 上達到最佳效能。

建議的採樣參數

Temperature：0.7
TopP：0.8
TopK：20
MinP：0

對於支援的框架，您可以將 presence_penalty 參數調整為 0 到 2 之間，以減少無盡的重複。不過，使用較高的值偶爾可能會導致語言混雜並略微降低模型效能。

輸出長度建議

標準使用：對於大多數查詢，使用 16,384 tokens 的輸出長度，這對指令模型來說已足夠。

複雜任務：對於需要廣泛推理或全面回應的任務，請考慮增加輸出長度，但保持在模型的上下文視窗限制內。

特定任務提示指南

數學問題：在提示詞中加入以下指引：複製

"請逐步推理，並將最終答案放在 \boxed{} 中。"

選擇題：加入以下 JSON 結構以標準化回應：複製

"請在答案欄位中僅顯示選項字母，例如 \"answer\": \"C\"。"

結論

Qwen3-235B-A22B-Instruct-2507 證明了開源 AI 可以與領先的商業模型有效競爭。憑藉在推理、編碼、數學和多語言任務方面媲美或超越 GPT-4o、Claude Opus 及其他業界領導者的效能，此模型以顯著降低的成本提供了先進的 AI 能力。

準備好將高效能 AI 整合到您的應用程式中了嗎？立即在 Novita AI 平台上試用 Qwen3-235B-A22B-Instruct-2507。

Novita AI 是一個 AI 雲端平台，為開發者提供透過簡單 API 部署 AI 模型的簡便途徑，同時也提供經濟且可靠的 GPU 雲端，用於建置和擴展。

Qwen3-235B-A22B-Instruct-2507 現已於 Novita AI 上架

什麼是 Qwen3-235B-A22B-Instruct-2507？

突破性增強

技術卓越性

效能基準

全面效能結果

關鍵效能亮點

如何在 Novita AI 上存取 Qwen3-235B-A22B-Instruct-2507

使用 Playground（無需編碼）

透過 API 整合（適用於開發者）

選項 1：直接 API 整合（Python 範例）

選項 2：使用 OpenAI Agents SDK 建立多代理工作流程

與第三方平台連接

達到最佳效能的實務指南

建議的採樣參數

輸出長度建議

特定任務提示指南

結論

Product

RESOURCES

Partners

Company

什麼是 Qwen3-235B-A22B-Instruct-2507？

突破性增強

技術卓越性

效能基準

全面效能結果

關鍵效能亮點

如何在 Novita AI 上存取 Qwen3-235B-A22B-Instruct-2507

使用 Playground（無需編碼）

透過 API 整合（適用於開發者）

選項 1：直接 API 整合（Python 範例）

選項 2：使用 OpenAI Agents SDK 建立多代理工作流程

與第三方平台連接

達到最佳效能的實務指南

建議的採樣參數

輸出長度建議

特定任務提示指南

結論

相關文章

Product

RESOURCES

Partners

Company