DeepSeek-R1-0528 et DeepSeek-R1-0528-Qwen3-8B désormais disponibles sur Novita AI

Table des matières

Qu'est-ce que DeepSeek-R1-0528 ?
DeepSeek-R1 vs DeepSeek-R1-0528
DeepSeek-R1-0528-Qwen3-8B : l'excellence compacte
Améliorations d'utilisation et détails techniques
Pourquoi les développeurs choisissent Novita AI
Commencer avec Novita AI
Conclusion

DeepSeek a lancé deux modèles révolutionnaires — DeepSeek-R1-0528 et DeepSeek-R1-0528-Qwen3-8B — désormais disponibles sur Novita AI, une plateforme cloud IA qui permet aux développeurs de déployer facilement des modèles d’IA via notre API simple. Ces modèles offrent des capacités de raisonnement exceptionnelles à des prix compétitifs, avec des performances nettement supérieures à celles de leurs prédécesseurs.

Novita AI propose les deux modèles DeepSeek-R1-0528 à des tarifs compétitifs avec une tarification transparente à l’utilisation :

DeepSeek-R1-0528 (Modèle complet) :

Tokens d’entrée : 0,70 $ par million de tokens
Tokens de sortie : 2,50 $ par million de tokens

DeepSeek-R1-0528-Qwen3-8B (Modèle 8B efficace) :

Tokens d’entrée : 0,06 $ par million de tokens
Tokens de sortie : 0,09 $ par million de tokens

Essayez la démo DeepSeek-R1-0528

Qu’est-ce que DeepSeek-R1-0528 ?

Le modèle DeepSeek R1 a bénéficié d’une mise à niveau mineure, la version actuelle étant DeepSeek-R1-0528. Dans cette dernière mise à jour, DeepSeek R1 a considérablement amélioré sa profondeur de raisonnement et ses capacités d’inférence en utilisant davantage de ressources de calcul et en introduisant des mécanismes d’optimisation algorithmique lors du post-entraînement.

Le modèle démontre des performances exceptionnelles sur diverses évaluations de référence, notamment en mathématiques, en programmation et en logique générale. Ses performances globales se rapprochent désormais de celles des modèles leaders, tels que O3 et Gemini 2.5 Pro.

Principales améliorations de DeepSeek-R1-0528

🔹 Performances améliorées sur les tests de référence en mathématiques, codage et raisonnement
🔹 Capacités front-end renforcées pour une meilleure expérience utilisateur
🔹 Réduction des hallucinations pour des sorties plus fiables
🔹 Prise en charge du format JSON et de l’appel de fonction pour une intégration fluide

Profondeur de raisonnement accrue

Par rapport à la version précédente, le modèle mis à jour montre des améliorations significatives dans le traitement des tâches de raisonnement complexes. Par exemple, dans le test AIME 2025, la précision du modèle est passée de 70 % dans la version précédente à 87,5 % dans la version actuelle.

Cette avancée provient d’une profondeur de réflexion accrue pendant le raisonnement : dans l’ensemble de test AIME, le modèle précédent utilisait en moyenne 12 000 tokens par question, tandis que la nouvelle version utilise en moyenne 23 000 tokens par question.

Performances compétitives face aux leaders du secteur

DeepSeek-R1-0528 démontre des performances remarquables par rapport aux modèles leaders du secteur sur plusieurs benchmarks exigeants :

DeepSeek-R1 vs DeepSeek-R1-0528

Performances en raisonnement mathématique

Benchmark	DeepSeek R1	DeepSeek R1-0528	Amélioration
AIME 2024 (Pass@1)	79,8	91,4	+11,6
AIME 2025 (Pass@1)	70,0	87,5	+17,5
HMMT 2025 (Pass@1)	41,7	79,4	+37,7
CNMO 2024 (Pass@1)	78,8	86,9	+8,1

Amélioration des performances en codage

Benchmark	DeepSeek R1	DeepSeek R1-0528	Amélioration
LiveCodeBench (Pass@1)	63,5	73,3	+9,8
Codeforces-Div1 (Rating)	1530	1930	+400
SWE Verified (Resolved)	49,2	57,6	+8,4
Aider-Polyglot (Acc.)	53,3	71,6	+18,3

Tâches de raisonnement général

Benchmark	DeepSeek R1	DeepSeek R1-0528	Amélioration
MMLU-Redux (EM)	92,9	93,4	+0,5
MMLU-Pro (EM)	84,0	85,0	+1,0
GPQA-Diamond (Pass@1)	71,5	81,0	+9,5
SimpleQA (Correct)	30,1	27,8	-2,3
FRAMES (Acc.)	82,5	83,0	+0,5
Humanity’s Last Exam (Pass@1)	8,5	17,7	+9,2

Nouvelles capacités d’intégration d’outils

DeepSeek-R1-0528 introduit des capacités améliorées d’appel de fonction et d’intégration d’outils :

BFCL_v3_MultiTurn (Acc) : 37,0 %
Tau-Bench (Pass@1) : 53,5 % (Compagnie aérienne) / 63,9 % (Commerce de détail)

DeepSeek-R1-0528-Qwen3-8B : l’excellence compacte

DeepSeek a distillé le raisonnement en chaîne de pensée de DeepSeek-R1-0528 pour créer DeepSeek-R1-0528-Qwen3-8B à partir de Qwen3 8B Base. Ce modèle atteint des performances de pointe (SOTA) parmi les modèles open source sur AIME 2024, surpassant Qwen3-8B de +10,0 % et égalant les performances de Qwen3-235B-thinking.

Cela démontre que la chaîne de pensée de DeepSeek-R1-0528 revêt une grande importance tant pour la recherche académique sur les modèles de raisonnement que pour le développement industriel axé sur les modèles à petite échelle.

Analyse comparative avec les modèles leaders

Modèle	AIME 24	AIME 25	HMMT Feb 25	GPQA Diamond	LiveCodeBench
Qwen3-235B-A22B	85,7	81,5	62,5	71,1	66,5
Qwen3-32B	81,4	72,9	-	68,4	-
Qwen3-8B	76,0	67,3	-	62,0	-
Phi-4-Reasoning-Plus-14B	81,3	78,0	53,6	69,3	-
Gemini-2.5-Flash-Thinking-0520	82,3	72,0	64,2	82,8	62,3
o3-mini (medium)	79,6	76,7	53,3	76,8	65,9
DeepSeek-R1-0528-Qwen3-8B	86,0	76,3	61,5	61,1	60,5

Améliorations d’utilisation et détails techniques

Fonctionnalités de convivialité améliorées

Par rapport aux versions précédentes de DeepSeek-R1, les recommandations d’utilisation de DeepSeek-R1-0528 incluent les améliorations suivantes :

Prise en charge des invites système : contrairement aux versions antérieures, vous pouvez désormais utiliser des invites système pour fournir un contexte et des instructions cohérents
Mode de réflexion automatique : plus besoin d’activation manuelle — le modèle engage automatiquement ses capacités de raisonnement sans avoir besoin de "thinking\ " au début des sorties

Architecture de DeepSeek-R1-0528-Qwen3-8B

L’architecture du modèle DeepSeek-R1-0528-Qwen3-8B est identique à celle de Qwen3-8B, mais il partage la même configuration de tokenizer que DeepSeek-R1-0528. Ce modèle peut s’exécuter de la même manière que Qwen3-8B, mais assurez-vous que tous les fichiers de configuration proviennent du dépôt de DeepSeek, et non du projet Qwen3 d’origine.

Pourquoi les développeurs choisissent Novita AI

Déploiement simplifié des modèles d’IA

Aucune contrainte d’infrastructure : concentrez-vous sur la création d’applications, pas sur la gestion de serveurs
Accès instantané aux modèles : déployez des modèles à la pointe de la technologie avec un seul appel API
Performances fiables : infrastructure de qualité entreprise avec une disponibilité de 99,9 %
Disponibilité mondiale : accès à faible latence depuis n’importe où dans le monde

Parfait pour toute échelle

Prototypage rapide : testez rapidement vos idées avec un accès immédiat aux modèles
Prêt pour la production : passez sans difficulté du prototype à la production
Rentable : ne payez que ce que vous utilisez avec une tarification transparente
Support entreprise : assistance dédiée pour les applications à volume élevé

Cas d’utilisation idéaux

Applications mathématiques d’IA : créez des plateformes de tutorat atteignant 87,5 % de précision sur AIME 2025
Outils de génération de code : créez des assistants de développement avec un taux de réussite de 73,3 % sur LiveCodeBench
Plateformes de recherche : déployez des modèles de raisonnement qui rivalisent avec les leaders du secteur
Logiciels éducatifs : développez des applications de résolution de problèmes étape par étape

Commencer avec Novita AI

Inscrivez-vous en quelques secondes sur Novita AI et obtenez 10 $ de crédits gratuits
Explorez DeepSeek-R1-0528 (capacité complète) ou DeepSeek-R1-0528-Qwen3-8B (efficace)
Obtenez votre clé API depuis le tableau de bord
Effectuez votre premier appel API en utilisant nos points d’accès compatibles avec OpenAI
Commencez à construire avec des capacités de raisonnement de pointe

Pour les utilisateurs Python :

from openai import OpenAI

base_url = "https://api.novita.ai/v3/openai"
api_key = "<Your API Key>"
model = "deepseek/deepseek-r1-0528"

client = OpenAI(
    base_url=base_url,
    api_key=api_key,
)

stream = True # or False
max_tokens = 1000

response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    extra_body={
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Conclusion

Les modèles de la série DeepSeek-R1-0528 offrent des performances de pointe à des prix compétitifs — atteignant 91,4 % sur AIME 2024 et 73,3 % sur LiveCodeBench tout en rivalisant avec les capacités d’OpenAI-o3 et Gemini-2.5-Pro.

Grâce à la plateforme conviviale pour développeurs de Novita AI, vous accédez instantanément à ces modèles de pointe sans complexité d’infrastructure. Avec une tarification transparente, 10 $ de crédits gratuits et notre API intuitive, intégrer un raisonnement de classe mondiale dans vos applications n’a jamais été aussi simple.

Novita AI est une plateforme cloud d’IA qui offre aux développeurs un moyen simple de déployer des modèles d’IA via notre API, tout en fournissant un cloud GPU abordable et fiable pour la construction de vos projets.

DeepSeek-R1-0528 et DeepSeek-R1-0528-Qwen3-8B désormais disponibles sur Novita AI

Qu’est-ce que DeepSeek-R1-0528 ?