Qwen 3 0.6B,1.7B,4B sont gratuits sur Novita AI !

Qwen 3 0.6B,1.7B,4B sont gratuits sur Novita AI !

Parrainez vos amis sur Novita AI et vous recevrez tous les deux 10 $ de crédits API LLM — jusqu’à 500 $ de récompenses au total.

Pour soutenir la communauté des développeurs, Qwen2.5-7B, Qwen 3 0.6B, Qwen 3 1.7B, Qwen 3 4B sont actuellement disponibles gratuitement sur Novita AI.

qwen 2.5 7b

Qwen3, une famille de modèles d’IA, est conçue pour les développeurs recherchant des capacités de pointe en raisonnement, support multilingue et efficacité légère. Grâce à un accès gratuit sur la plateforme Novita AI et une intégration API transparente, Qwen3 permet des applications dynamiques, de l’assistance au codage à la résolution de problèmes complexes.

qwen 3

Fonctionnalités clés de Qwen 3

Modes de pensée hybrides

Les modèles Qwen3 introduisent une approche hybride de résolution de problèmes avec deux modes :

  1. Mode Pensée : Pour les problèmes complexes, le modèle raisonne étape par étape, fournissant des réponses réfléchies.
  2. Mode Non-Pensée : Pour les tâches plus simples, le modèle fournit des réponses rapides, quasi instantanées.

Cette flexibilité permet aux utilisateurs de contrôler l’effort de raisonnement du modèle en fonction des exigences de la tâche. Les problèmes plus difficiles bénéficient d’un raisonnement étendu, tandis que les plus simples sont résolus rapidement.

En combinant ces modes, Qwen3 atteint un contrôle stable et efficace du budget de pensée, offrant des améliorations de performance évolutives liées aux budgets de raisonnement computationnel alloués. Cette conception facilite la budgétisation spécifique aux tâches, en équilibrant l’efficacité des coûts et la qualité de l’inférence.

Support multilingue

Les modèles Qwen3 prennent en charge 119 langues et dialectes, ouvrant de nouvelles possibilités pour les applications mondiales. Optimisé pour le codage, les capacités agentiques et MCP, Qwen3 permet aux utilisateurs du monde entier de tirer parti efficacement de sa puissance.

Capacités agentiques améliorées

Qwen3 est optimisé pour le codage et les capacités agentiques, avec un support amélioré pour MCP. Vous trouverez ci-dessous des exemples démontrant comment Qwen3 pense et interagit avec son environnement.

Petits modèles Qwen 3

Petits modèles Qwen 3

L’Embedding Lié (Tie Embedding) est une technique couramment utilisée dans les modèles de traitement automatique du langage naturel (NLP) pour partager les poids entre différentes couches d’embedding. Plus précisément, il s’agit de lier (ou partager) les poids de la couche d’embedding d’entrée et de la couche d’embedding de sortie dans un réseau neuronal, en particulier dans les modèles de langage comme les transformers.

Méthodes d’entraînement des petits modèles Qwen 3

Méthodes d'entraînement

À partir du diagramme, nous pouvons déduire que Qwen 3 0.6B,1.7B,4B ont été entraînés via un processus de Distillation Fort-à-Faible (Strong-to-Weak Distillation), qui fait partie du pipeline de création de Modèles Légers (Lightweight Models). Voici une ventilation étape par étape du processus d’entraînement :

  1. Modèles de base (Base Models) :
    Le processus commence par des Modèles de base pré-entraînés, qui servent de base pour l’entraînement et la distillation ultérieurs.
  2. Modèles de pointe (Frontier Models) :
    • Les modèles de base sont d’abord entraînés via un processus en plusieurs étapes pour créer des Modèles de pointe comme Qwen3-235B-A22B et Qwen3-32B.
    • Cet entraînement comprend :
      • Étape 1 (Démarrage à froid Long-CoT) : Entraînement initial avec un raisonnement à longue chaîne de pensée (CoT).
      • Étape 2 (RL de raisonnement) : Apprentissage par renforcement (RL) pour améliorer les capacités de raisonnement.
      • Étape 3 (Fusion des modes de pensée) : Intégration des modes de pensée (par exemple, modes de raisonnement et de réponse rapide).
      • Étape 4 (RL général) : Apprentissage par renforcement général pour des capacités plus larges.
  3. Distillation Fort-à-Faible (Strong-to-Weak Distillation) :
    • Les grands Modèles de pointe (par exemple, Qwen3-235B et Qwen3-32B) sont ensuite utilisés comme modèles enseignants pour guider l’entraînement des Modèles Légers comme Qwen3-4B.
    • Ce processus de distillation garantit que les modèles plus petits conservent les connaissances et les performances des modèles plus grands tout en réduisant considérablement la taille et les exigences computationnelles.
  4. Qwen3-4B :
    • Grâce à ce processus de distillation, Qwen 3 0.6B,1.7B,4B constituent une version légère, bénéficiant des connaissances des modèles plus grands tout en étant optimisés pour l’efficacité.

Comment accéder aux petits modèles Qwen 3 via l’API Novita ?

Étape 1 : Connectez-vous et accédez à la bibliothèque de modèles

Connectez-vous à votre compte et cliquez sur le bouton Bibliothèque de modèles.

Connectez-vous et accédez à la bibliothèque de modèles

Étape 2 : Choisissez votre modèle

Parcourez les options disponibles et sélectionnez le modèle qui correspond à vos besoins.

Choisissez votre modèle

Étape 3 : Commencez votre essai gratuit

Commencez votre essai gratuit pour explorer les capacités du modèle sélectionné.

Commencez votre essai gratuit

Essayez Qwen 3 maintenant !

Étape 4 : Obtenez votre clé API

Pour vous authentifier auprès de l’API, nous vous fournirons une nouvelle clé API. En entrant dans la page « Paramètres », vous pouvez copier la clé API comme indiqué dans l’image.

Obtenez votre clé API

Étape 5 : Installez l’API

Installez l’API à l’aide du gestionnaire de paquets spécifique à votre langage de programmation.

Installez l'API

Après l’installation, importez les bibliothèques nécessaires dans votre environnement de développement. Initialisez l’API avec votre clé API pour commencer à interagir avec Novita AI LLM. Voici un exemple d’utilisation de l’API de chat completions pour les utilisateurs Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "qwen3-0.6b-fp8"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  
  

Qwen3 offre une polyvalence inégalée avec ses modes de pensée hybrides, ses capacités multilingues et son efficacité légère. Que vous résolviez des problèmes complexes ou que vous construisiez des applications mondiales, Qwen3 vous permet d’aller plus loin. Commencez votre parcours dès aujourd’hui avec l’accès gratuit de Novita AI et explorez l’avenir du développement alimenté par l’IA.

Foire aux questions

Quelles sont les fonctionnalités uniques de Qwen3 ?

Modes de pensée hybrides, support multilingue, efficacité légère (modèles 0.6B, 1.7B, 4B) et capacités de codage améliorées.

Comment accéder aux modèles Qwen3 ?

Connectez-vous à Novita AI, sélectionnez un modèle, obtenez votre clé API et intégrez-la dans votre projet à l’aide de la documentation fournie.

Les modèles Qwen3 sont-ils gratuits ?

Oui ! Novita AI propose un accès gratuit aux modèles Qwen3 avec une intégration API facile.

*Novita AI est une plateforme cloud d’IA qui offre aux développeurs un moyen simple de déployer des modèles d’IA en utilisant notre API simple, tout en fournissant un cloud GPU abordable et fiable pour construire et mettre à l’échelle.

Lectures recommandées