Qwen3-235B-A22B-Instruct-2507 現已於 Novita AI 上架

Qwen3-235B-A22B-Instruct-2507 現已於 Novita AI 上架

阿里巴巴革命性的 Qwen3-235B-A22B-Instruct-2507 現已於 Novita AI 上線。

憑藉媲美甚至超越 GPT-4o、Claude Opus 及其他業界領先模型的基準評分,Qwen3-235B-A22B-Instruct-2507 以極低的成本提供企業級效能。無論您是打造次世代聊天機器人、複雜推理系統,還是多語言應用程式,此模型重新定義了生產環境中可實現的目標。

Novita AI 目前定價:輸入 tokens 每 M 單位 $0.15 美元,輸出 tokens 每 M 單位 $0.8 美元

體驗 Qwen3-235B-A22B-Instruct-2507 展示

什麼是 Qwen3-235B-A22B-Instruct-2507?

Qwen3-235B-A22B-Instruct-2507 是阿里巴巴旗艦 235B 參數模型的增強版本,在指令遵循、數學推理、編碼能力和使用者對齊方面有顯著改進。該模型基於基礎 Qwen3-235B-A22B 架構,並通過針對性優化在關鍵基準測試中實現了可衡量的效能提升。

突破性增強

革命性的能力提升:在指令遵循、邏輯推理、文字理解、數學、科學、編碼和工具使用方面體驗大幅躍進,超越最先進的商業模型。

前所未有的知識掌握:在多語言的長尾知識覆蓋方面取得巨大進展,實現了以前開源模型無法達到的應用。

完美的使用者對齊:在主觀和開放式任務中與使用者偏好完美對齊,提供自然且上下文完美的回應。

擴展上下文掌握:革命性的 256K 長上下文理解,可在整個文件、研究論文和長時間對話中保持完美的連貫性。

技術卓越性

  • 類型:因果語言模型
  • 訓練階段:預訓練與後期訓練
  • 總參數量:235B,其中 22B 被啟用
  • 非嵌入參數:234B
  • 架構:94 層
  • 注意力頭 (GQA):Q 為 64,KV 為 4
  • 專家數:總共 128 個專家,8 個專家被啟用
  • 上下文長度:原生支援 262,144 tokens
  • 模式:僅非思考模式(不會產生 thinking response 區塊)

效能基準

Qwen3-235B-A22B-Instruct-2507 不僅能與業界領導者競爭,更能超越它們。在全面的評估基準中,此模型始終優於 GPT-4o、Claude Opus 4、Deepseek-V3 及其他高階模型,而且經常大幅領先。

Qwen/Qwen3-235B-A22B-Instruct-2507 benchmark

全面效能結果

benchmark of Qwen3-235B-A22B-Instruct-2507

關鍵效能亮點

數學卓越性:在 AIME25 上達到驚人的 70.3%,在 HMMT25 上達到 55.4%,展現了無與倫比的數學推理能力,顯著超越所有競爭對手。

邏輯推理精通:在 ZebraLogic 上以傑出的 95.0% 展示近乎完美的邏輯演繹能力,而在 ARC-AGI 上的 41.8% 則證明了強大的抽象推理能力。

優越的知識理解能力:在知識基準測試中表現領先,包括 GPQA 的 77.5% 和 SimpleQA 的 54.3%,為事實準確性樹立了新標準。

編碼領導地位:在 LiveCodeBench v6(51.8%)上表現最佳,在 MultiPL-E(87.9%)上也有強勁表現,確認了其在多種程式語言中卓越的程式設計能力。

使用者偏好對齊:在 Arena-Hard v2 上達到 79.2%,展現了與人類偏好和期望的優異對齊。

多語言卓越性:在所有多語言基準測試中表現強勁,MultiIF 為 77.5%,PolyMATH 為 50.2%,展現了真正的全球語言能力。

如何在 Novita AI 上存取 Qwen3-235B-A22B-Instruct-2507

在 Novita AI 上開始使用 Qwen3-235B-A22B-Instruct-2507 非常簡單,專為需要可靠高效能語言模型存取的開發者和研究人員設計。

使用 Playground(無需編碼)

即時存取:註冊後即可在幾秒內開始體驗 Qwen3-235B-A22B-Instruct-2507 以及其他頂級模型。

互動式介面:透過我們直觀的 Playground 測試複雜提示詞、評估推理能力並即時視覺化結果。

模型比較:輕鬆比較 Qwen3-235B-A22B-Instruct-2507 與其他領先模型,為您的特定使用案例找到完美的解決方案。

透過 API 整合(適用於開發者)

使用 Novita AI 的統一 REST API 將 Qwen3-235B-A22B-Instruct-2507 連接到您的應用程式。無需管理基礎設施,只需專注於打造出色的產品。

選項 1:直接 API 整合(Python 範例)

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "qwen/qwen3-235b-a22b-instruct-2507"
stream = True # or False
max_tokens = 131072
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

主要特色

  • 與 OpenAI 相容的 API:與現有的 OpenAI 工作流程無縫整合
  • 靈活的參數控制:透過全面的參數選項微調模型行為
  • 串流支援:選擇即時串流或批次回應

選項 2:使用 OpenAI Agents SDK 建立多代理工作流程

使用 Qwen3-235B-A22B-Instruct-2507 建立複雜的多代理系統:

  • 即插即用整合:在任何 OpenAI Agents 工作流程 中使用 Novita AI 的模型
  • 進階代理能力:支援交接、路由和工具整合
  • 可擴展架構:設計可委派任務並執行複雜功能的代理

與第三方平台連接

開發工具:透過與 OpenAI 相容的 API,無縫整合熱門的 IDE 和開發環境,例如 Cursor、Continue、Trae 和 Cline。

編排框架:使用官方連接器與 LangChain、Dify、Langflow 和其他 AI 編排平台連接。

Hugging Face 整合:透過 Novita AI 端點,在 Spaces、pipelines 或使用 Transformers 函式庫時使用 Qwen3-235B-A22B-Instruct-2507。

達到最佳效能的實務指南

根據 Qwen 團隊的官方建議,請遵循以下指南以在 Qwen3-235B-A22B-Instruct-2507 上達到最佳效能。

建議的採樣參數

Temperature:0.7
TopP:0.8
TopK:20
MinP:0

對於支援的框架,您可以將 presence_penalty 參數調整為 0 到 2 之間,以減少無盡的重複。不過,使用較高的值偶爾可能會導致語言混雜並略微降低模型效能。

輸出長度建議

標準使用:對於大多數查詢,使用 16,384 tokens 的輸出長度,這對指令模型來說已足夠。

複雜任務:對於需要廣泛推理或全面回應的任務,請考慮增加輸出長度,但保持在模型的上下文視窗限制內。

特定任務提示指南

數學問題:在提示詞中加入以下指引:複製

"請逐步推理,並將最終答案放在 \boxed{} 中。"

選擇題:加入以下 JSON 結構以標準化回應:複製

"請在答案欄位中僅顯示選項字母,例如 \"answer\": \"C\"。"

結論

Qwen3-235B-A22B-Instruct-2507 證明了開源 AI 可以與領先的商業模型有效競爭。憑藉在推理、編碼、數學和多語言任務方面媲美或超越 GPT-4o、Claude Opus 及其他業界領導者的效能,此模型以顯著降低的成本提供了先進的 AI 能力。

準備好將高效能 AI 整合到您的應用程式中了嗎?立即在 Novita AI 平台上試用 Qwen3-235B-A22B-Instruct-2507

Novita AI 是一個 AI 雲端平台,為開發者提供透過簡單 API 部署 AI 模型的簡便途徑,同時也提供經濟且可靠的 GPU 雲端,用於建置和擴展。