DeepSeek R1 7B : 90 % de la puissance de DeepSeek R1 avec une efficacité matérielle 10 fois supérieure

DeepSeek R1 7B : 90 % de la puissance de DeepSeek R1 avec une efficacité matérielle 10 fois supérieure

Parrainez vos amis dès aujourd’hui et recevez chacun 10 $ de crédits API LLM — soit jusqu’à 500 $ de récompenses totales qui vous attendent !

Llama 3.2 1B, Qwen2.5 7B, Qwen 3 (0.6B, 1.7B, 4B), GLM 4 — tous disponibles gratuitement sur Novita AI pour dynamiser vos projets sans dépenser un centime !

Construisez avec Novita AI dès aujourd’hui !

Vous cherchez à exploiter la puissance de l’IA avancée sans vous ruiner en matériel ? DeepSeek R1 Distill Qwen 7B offre 90 % des performances du massif DeepSeek R1 671B tout en réduisant considérablement les besoins matériels. Avec une version quantifiée qui fonctionne sur des GPU de milieu de gamme (dès 4,5 Go de VRAM), ce modèle permet aux développeurs de traiter le raisonnement mathématique, les tâches multilingues et bien plus encore, de manière efficace et abordable.

Cet article vous montrera comment DeepSeek R1 Distill Qwen 7B peut vous aider !

Qu’est-ce que DeepSeek R1 Distill Qwen 7B ?

Qu'est-ce que DeepSeek R1 Distill Qwen 7B ?

Benchmark de DeepSeek R1 Distill Qwen 7B

Modèle AIME 2024 pass@1 AIME 2024 cons@64 MATH-500 pass@1 GPQA Diamond pass@1 LiveCodeBench pass@1 CodeForces rating
GPT 4o 0513 9.3 13.4 74.6 49.9 32.9 759
Claude 3.5 Sonnet 1022 16.0 26.7 78.3 65.0 38.9 717
o1 mini 63.6 80.0 90.0 60.0 53.8 1820
QwQ 32B Preview 44.0 60.0 90.6 54.5 41.9 1316
DeepSeek R1 Distill Qwen 7B 55.5 83.3 92.8 49.1 37.6 1189

DeepSeek R1 Distill Qwen 7B est un sérieux concurrent dans les tâches de raisonnement mathématique, montrant des résultats compétitifs en performances générales.

Cependant, il est en retard dans les benchmarks généraux de questions-réponses et de programmation par rapport aux modèles les plus performants comme o1 mini et QwQ 32B Preview.

Ses performances mathématiques exceptionnelles sont probablement dues à son modèle de base Qwen 2.5 Math, qui est hautement optimisé pour les tâches de raisonnement.

Exigences matérielles de DeepSeek R1 Distill Qwen 7B

Type de modèle Nom Taille Exigences matérielles
Modèle complet DeepSeek-R1-Distill-Qwen-7B ~18 Go NVIDIA RTX 4090 (24 Go VRAM) ou supérieur
Modèle quantifié DeepSeek-R1-Distill-Qwen-7B ~4,5 Go NVIDIA RTX 3060 (12 Go VRAM) ou supérieur

Grâce à la distillation, DeepSeek R1 Distill Qwen 7B réduit considérablement les besoins matériels tout en conservant plus de 90 % des performances du modèle original de 671B, notamment en raisonnement mathématique et en tâches de questions-réponses. Son modèle quantifié améliore encore l’accessibilité en permettant un déploiement sur des GPU de milieu de gamme.

DeepSeek R1 Distill Qwen 7B vs autres petits modèles

DeepSeek R1 Distill Qwen 7B vs Qwen 2.5 7B

Catégorie DeepSeek R1 Distill Qwen 7B Qwen-2.5-7B
Taille du modèle 7,62B 7,61B
Open Source Oui Oui
Architecture Transformer Transformer
Langues supportées 29+ langues 29+ langues
Multimodal Texte vers texte uniquement Texte vers texte uniquement
Données d’entraînement Ajusté sur des données de raisonnement 18 000 milliards de tokens
MATH (pass@1) 92,8 49,8
GPQA (pass@1) 49,1 36,4
VRAM (modèle complet) 18 Go (RTX 4090 ou supérieur) 17,18 Go (RTX 4090)

DeepSeek-R1-Distill-Qwen-7B : Performant en mathématiques, besoins matériels réduits (modèle quantifié disponible).

Qwen-2.5-7B : Performances équilibrées, excellent en codage et tâches multilingues, entraîné sur un plus grand ensemble de données.

DeepSeek R1 Distill Qwen 7B vs Qwen 3 8B

Catégorie DeepSeek R1 Distill Qwen 7B Qwen 3 8B
Taille du modèle 7,62B 8,19B
Open Source Oui Oui
Architecture Transformer Dense
Langues supportées 29+ langues 119 langues
Multimodal Texte vers texte uniquement Texte vers texte uniquement
MATH (pass@1) 92,8 90,0
GPQA (pass@1) 49,1 59,0
VRAM (modèle complet) 18 Go (RTX 4090) 17,89 Go (RTX 4090)

DeepSeek : Idéal pour les tâches mathématiques et besoins GPU réduits (modèle quantifié).

Qwen 3 8B : Meilleur pour les tâches multilingues et les applications à long contexte.

DeepSeek R1 Distill Qwen 7B vs Llama 3.1 8B

Catégorie DeepSeek R1 Distill Qwen 7B Llama 3.1 8B
Taille du modèle 7,62B 8B
Open Source Oui Oui
Architecture Transformer Dense Transformer
Langues supportées 29+ langues 8 langues
Multimodal Texte vers texte Texte, Code (Entrée/Sortie)
Données d’entraînement Ajusté sur des données de raisonnement Pré-entraîné sur ~15T tokens, ajusté avec 25M exemples synthétiques
MATH (pass@1) 92,8 51,9 (CoT)
GPQA (pass@1) 49,1 30,4
VRAM (modèle complet) 18 Go (RTX 4090, FP16) 17,17 Go (RTX 3090, FP16)

DeepSeek-R1-Distill-Qwen-7B : Plus performant en mathématiques et raisonnement.

Llama 3.1 8B : Excellent en génération de code et support d’un contexte plus long (128 000 tokens), ce qui le rend meilleur pour les tâches complexes à long contexte.

Comment accéder aux modèles distillés DeepSeek R1 ?

Novita AI est une plateforme cloud IA qui offre aux développeurs un moyen simple de déployer des modèles d’IA via une API simple, tout en fournissant un cloud GPU fiable et abordable pour construire et passer à l’échelle.

En plus des modèles distillés DeepSeek R1, Novita AI propose également gratuitement Qwen2.5 7B, Qwen 3 (0.6B, 1.7B, 4B), GLM 4 pour soutenir le développement de la communauté open source !

Étape 1 : Connectez-vous et accédez à la bibliothèque de modèles

Connectez-vous à votre compte et cliquez sur le bouton Model Library.

Connectez-vous et accédez à la bibliothèque de modèles

Essayez les modèles distillés DeepSeek R1 dès maintenant !

Étape 2 : Choisissez votre modèle et démarrez un essai gratuit

Parcourez les options disponibles et sélectionnez le modèle qui correspond à vos besoins.

Étape 2 : Choisissez votre modèle et démarrez un essai gratuit

Étape 3 : Obtenez votre clé API

Pour vous authentifier avec l’API, nous vous fournirons une nouvelle clé API. Accédez à la page « Settings », vous pouvez copier la clé API comme indiqué sur l’image.

obtenir la clé API

Étape 4 : Installez l’API

Installez l’API à l’aide du gestionnaire de paquets spécifique à votre langage de programmation.

Après l’installation, importez les bibliothèques nécessaires dans votre environnement de développement. Initialisez l’API avec votre clé API pour commencer à interagir avec Novita AI LLM. Voici un exemple d’utilisation de l’API chat completions pour les utilisateurs Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="session_nkvtuVXXxS-LlR7txjZ3Rox8GhLMuv1R8IrIySNwTPN7xHJ0SVErFx3kNwJgkUEpcSM4F8c6zmcvyfuc1h59gw==",
)

model = "deepseek/deepseek-r1-distill-llama-8b"
stream = True # or False
max_tokens = 2048
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

DeepSeek-R1-Distill-Qwen-7B est un modèle hautement optimisé pour les tâches de raisonnement mathématique, atteignant des performances exceptionnelles dans des benchmarks comme MATH. Bien qu’il soit légèrement en retard dans les tâches générales de questions-réponses et de codage par rapport à d’autres modèles performants, ses besoins matériels réduits (avec une option de modèle quantifié) le rendent accessible à un public plus large.

Questions fréquemment posées

Qu’est-ce que DeepSeek R1 Distill Qwen 7B ?

DeepSeek-R1-Distill-Qwen-7B est une version distillée et ajustée de Qwen 2.5 Math, optimisée pour le raisonnement mathématique et les tâches de questions-réponses. Il prend en charge le traitement de texte multilingue et propose un modèle quantifié pour un déploiement sur des GPU de milieu de gamme.

Quels sont les besoins matériels pour DeepSeek R1 Distill Qwen 7B ?

Modèle complet : ~18 Go VRAM (NVIDIA RTX 4090 ou supérieur).
Modèle quantifié : ~4,5 Go VRAM (NVIDIA RTX 3060 ou supérieur).

Pourquoi utiliser DeepSeek R1 Distill Qwen 7B ?

Qwen3-Reranker-8B obtient des scores de premier plan :
MTEB-R : 69,02,
CMTEB-R : 77,45,
MTEB-Code : 81,22
Il surpasse des modèles populaires comme BGE et GTE dans plusieurs catégories.

Novita AI est la plateforme cloud tout-en-un qui propulse vos ambitions IA. API intégrées, serverless, instances GPU — les outils rentables dont vous avez besoin. Éliminez l’infrastructure, commencez gratuitement et concrétisez votre vision IA.

Lecture recommandée