推荐朋友加入 Novita AI,你们双方都能获得 $10 的 LLM API 额度——最高可累积 $500 奖励。
为支持开发者社区,Qwen2.5-7B、Qwen 3 0.6B、Qwen 3 1.7B、Qwen 3 4B 现已在 Novita AI 上免费提供。
Qwen3 是一个 AI 模型家族,专为追求 ** 推理、多语言支持和轻量高效前沿能力的开发者而设计。通过在 Novita AI 平台上的 ** 免费访问 和流畅的 API 集成,Qwen3 能够实现从代码辅助到复杂问题求解的动态应用。

Qwen 3 的主要特点
混合思考模式
Qwen3 模型 引入了两种模式的混合问题解决方式:
- 思考模式:针对复杂问题,模型逐步推理,提供周详的答案。
- 非思考模式:针对简单任务,模型快速响应,近乎即时。
这种灵活性让用户能够根据任务需求控制模型的推理投入程度。较难的问题受益于更长的推理过程,而简单问题则可快速解决。
通过结合这两种模式,Qwen3 实现了 ** 稳定且高效的思考预算控制**,能够根据分配的推理计算预算带来可扩展的性能提升。这种设计使得针对特定任务的预算管理更加容易,在 ** 成本效益和 ** 推理质量之间取得平衡。
多语言支持
**Qwen3 模型 ** 支持 119 种语言和方言,为全球应用开启了新的可能性。Qwen3 针对编程、智能体能力和 MCP 进行了优化,使全球用户都能有效利用其强大功能。
改进的智能体能力
Qwen3 针对编程和智能体能力进行了优化,并增强了对 MCP 的支持。以下示例展示了 Qwen3 如何进行思考并与其环境交互。
Qwen 3 小模型

Tie Embedding 是 ** 自然语言处理(NLP)模型中常用的一种技术,用于在不同嵌入层之间共享权重。具体来说,它指的是在神经网络(尤其是语言模型如 transformers)中 ** 绑定(或称共享)输入嵌入层和输出嵌入层的权重。
Qwen 3 小模型的训练方法

从图中可以推断,Qwen 3 0.6B、1.7B、4B 通过 ** 强到弱蒸馏过程进行训练,这是创建 ** 轻量模型流程的一部分。下面是训练过程的逐步分解:
- 基础模型:
流程从预训练的 基础模型 开始,它们作为后续训练和蒸馏的基础。 - 前沿模型:
- 基础模型首先通过多阶段训练创建 前沿模型,例如 Qwen3-235B-A22B 和 Qwen3-32B。
- 该训练包括:
- 阶段 1(长 CoT 冷启动):使用长思维链推理进行初始训练。
- 阶段 2(推理 RL):强化学习以增强推理能力。
- 阶段 3(思考模式融合):集成思考模式(例如推理模式和快速响应模式)。
- 阶段 4(通用 RL):面向更广泛能力的通用强化学习。
- 强到弱蒸馏:
- 大型 前沿模型(例如 Qwen3-235B 和 Qwen3-32B)随后被用作 ** 教师模型**,来指导 ** 轻量模型**(如 Qwen3-4B)的训练。
- 这一蒸馏过程确保较小模型保留较大模型的知识和性能,同时显著减小尺寸和计算需求。
- Qwen3-4B:
- 作为蒸馏过程的结果,Qwen 3 0.6B、1.7B、4B 成为轻量版本,受益于较大模型的知识,同时针对效率进行了优化。
如何通过 Novita API 访问 Qwen 3 小模型?
步骤 1:登录并访问模型库
登录您的账户,点击 模型库 按钮。

步骤 2:选择您的模型
浏览可用选项,选择适合您需求的模型。

步骤 3:开始免费试用
开始免费试用,探索所选模型的功能。

步骤 4:获取您的 API 密钥
为了通过 API 进行身份验证,我们将为您提供一个新的 API 密钥。进入“设置”页面,您可以按照图中所示复制 API 密钥。

步骤 5:安装 API
使用特定于您编程语言的包管理器安装 API。

安装完成后,将必要的库导入到您的开发环境中。使用您的 API 密钥初始化 API,开始与 Novita AI LLM 交互。以下是一个 Python 用户使用聊天补全 API 的示例。
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "qwen3-0.6b-fp8"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Qwen3 凭借其混合思考模式、多语言能力和轻量高效,提供了无与伦比的多功能性。无论您是解决复杂问题还是构建全球应用,Qwen3 都能助您实现更多目标。立即通过 Novita AI 的免费访问开启您的旅程,探索 AI 驱动开发的未来。
常见问题
Qwen3 有哪些独特功能?
混合思考模式、多语言支持、轻量高效(0.6B、1.7B、4B 模型)以及增强的编程能力。
如何访问 Qwen3 模型?
登录 Novita AI,选择一个模型,获取您的 API 密钥,然后按照提供的文档将其集成到您的项目中。
Qwen3 模型是免费的吗?
是的!Novita AI 免费提供 Qwen3 模型,并提供简便的 API 集成。
Novita AI 是一个 AI 云平台,为开发者提供通过简单 API 部署 AI 模型的便捷途径,同时还提供经济可靠的 GPU 云用于构建和扩展。

