阿里巴巴革命性的 Qwen3-235B-A22B-Instruct-2507 现已登陆 Novita AI。
凭借与 GPT-4o、Claude Opus 等业界领先模型相媲美甚至超越的基准测试分数,Qwen3-235B-A22B-Instruct-2507 以极低的成本提供企业级性能。无论你是在构建下一代聊天机器人、复杂推理系统还是多语言应用,这款模型重新定义了在生产环境中可实现的目标。
当前在 Novita AI 上的定价:$0.15 / 百万输入 tokens,$0.8 / 百万输出 tokens
尝试 Qwen3-235B-A22B-Instruct-2507 演示
Qwen3-235B-A22B-Instruct-2507 是什么?
Qwen3-235B-A22B-Instruct-2507 是阿里巴巴旗舰 235B 参数模型的增强版,在指令遵循、数学推理、编码能力和用户对齐方面进行了重大改进。该模型在基础 Qwen3-235B-A22B 架构上进行了针对性优化,在关键基准测试中带来了可衡量的性能提升。
突破性增强
革命性的能力提升:在指令遵循、逻辑推理、文本理解、数学、科学、编码和工具使用方面体验到巨大飞跃,超越了最先进的商业模型。
前所未有的知识掌握:在多种语言的长尾知识覆盖方面取得巨大进展,使之前开源模型无法实现的应用成为可能。
完美的用户对齐:在主观和开放式任务中与用户偏好的高度对齐,提供自然人性化且语境完美的响应。
扩展的上下文掌握:革命性的 256K 长上下文理解,在整篇文档、研究论文和扩展对话中保持完美的连贯性。
技术卓越性
- 类型:因果语言模型
- 训练阶段:预训练与后训练
- 总参数量:235B,激活参数 22B
- 非嵌入参数:234B
- 架构:94 层
- 注意力头(GQA):Q 为 64,KV 为 4
- 专家:总共 128 个,激活 8 个专家
- 上下文长度:原生 262,144 tokens
- 模式:仅非思考模式(不生成
<think></think>块)
性能基准
Qwen3-235B-A22B-Instruct-2507 不仅与行业领导者竞争,而且主导了它们。在全面的评估基准测试中,该模型始终优于 GPT-4o、Claude Opus 4、Deepseek-V3 等高级模型,通常有显著优势。

全面性能结果

关键性能亮点
数学卓越性:在 AIME25 上达到惊人的 70.3%,HMMT25 上为 55.4%,Qwen3-235B-A22B-Instruct-2507 展示了无与伦比的数学推理能力,显著优于所有竞争对手。
逻辑推理掌握:在 ZebraLogic 上达到出色的 95.0%,展示了近乎完美的逻辑演绎能力,而 ARC-AGI 上的 41.8% 则证明了强大的抽象推理能力。
优越的知识理解:在知识基准测试中领先,包括 GPQA 上的 77.5% 和 SimpleQA 上的 54.3%,为事实准确性树立了新标准。
编码领导力:在 LiveCodeBench v6 上取得顶尖性能(51.8%),在 MultiPL-E 上取得强劲结果(87.9%),证实了其在多种语言中的卓越编程能力。
用户偏好对齐:在 Arena-Hard v2 上获得 79.2% 的出色分数,展示了与人类偏好和期望的优越对齐。
多语言卓越性:在所有多语言基准测试中表现强劲,MultiIF 上 77.5%,PolyMATH 上 50.2%,展示了真正的全球语言能力。
如何在 Novita AI 上访问 Qwen3-235B-A22B-Instruct-2507
在 Novita AI 上使用 Qwen3-235B-A22B-Instruct-2507 非常简单,专为需要可靠、高性能语言模型访问的开发人员和研究人员设计。
使用 Playground(无需编码)
即时访问:注册并立即开始使用 Qwen3-235B-A22B-Instruct-2507 及其他顶级模型。
交互式界面:使用我们直观的 Playground 测试复杂提示,评估推理能力,并实时可视化结果。
模型比较:无缝比较 Qwen3-235B-A22B-Instruct-2507 与其他领先模型,为你的特定用例找到完美解决方案。
通过 API 集成(适用于开发者)
使用 Novita AI 的统一 REST API 将 Qwen3-235B-A22B-Instruct-2507 连接到你的应用程序。无需基础架构管理——只需专注于构建出色的产品。
选项 1:直接 API 集成(Python 示例)
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="",
)
model = "qwen/qwen3-235b-a22b-instruct-2507"
stream = True # or False
max_tokens = 131072
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
关键特性:
- 兼容 OpenAI 的 API:与现有基于 OpenAI 的工作流无缝集成
- 灵活的参数控制:通过全面的参数选项微调模型行为
- 流式支持:在实时流式或批量响应之间进行选择
选项 2:使用 OpenAI Agents SDK 的多智能体工作流
使用 Qwen3-235B-A22B-Instruct-2507 构建复杂的多智能体系统:
- 即插即用集成:在任何 OpenAI Agents 工作流 中使用 Novita AI 的模型
- 高级智能体能力:支持交接、路由和工具集成
- 可扩展架构:设计能够委派任务并运行复杂函数的智能体
连接第三方平台
开发工具:通过兼容 OpenAI 的 API 与流行的 IDE 和开发环境(如 Cursor、Continue、Trae 和 Cline)无缝集成。
编排框架:使用官方连接器连接到 LangChain、Dify、Langflow 和其他 AI 编排平台。
Hugging Face 集成:在 Spaces、管道中或通过 Novita AI 端点与 Transformers 库一起使用 Qwen3-235B-A22B-Instruct-2507。
最佳性能实践
根据 Qwen 团队的官方建议,遵循以下指南以使用 Qwen3-235B-A22B-Instruct-2507 实现最佳性能。
推荐采样参数
Temperature:0.7
TopP:0.8
TopK:20
MinP:0
对于支持的框架,你可以调整 presence_penalty 参数(范围 0 到 2)以减少无限重复。然而,使用较高值有时可能导致语言混合和模型性能轻微下降。
输出长度建议
标准使用:对于大多数查询,使用 16,384 tokens 的输出长度,这对于指令模型来说已经足够。
复杂任务:对于需要大量推理或全面响应的任务,可以考虑增加输出长度,但要保持在模型上下文窗口限制之内。
特定任务提示指南
数学问题:在提示中包含以下指导:
"Please reason step by step, and put your final answer within \boxed{}."
多项选择题:添加以下 JSON 结构以标准化响应:
"Please show your choice in the answer field with only the choice letter, e.g., \"answer\": \"C\"."
结论
Qwen3-235B-A22B-Instruct-2507 证明了开源 AI 可以与领先的商业模型有效竞争。凭借在推理、编码、数学和多语言任务中与 GPT-4o、Claude Opus 及其他行业领导者相匹配甚至超越的性能,该模型以显著降低的成本提供先进的 AI 能力。
准备好将高性能 AI 集成到你的应用程序中了吗?立即在 Novita AI 平台上尝试 Qwen3-235B-A22B-Instruct-2507。
Novita AI 是一个 AI 云平台,为开发人员提供通过简单 API 部署 AI 模型的便捷方式,同时提供经济实惠且可靠的 GPU 云用于构建和扩展。
