Points clés
DeepSeek V3 0324 apporte des améliorations substantielles dans le raisonnement logique, la résolution de problèmes mathématiques, la précision des appels de fonctions et la maîtrise des langues spécialisées.
Vous pouvez commencer un essai gratuit sur Novita AI !
Un point fort majeur est la fenêtre de contexte étendue de 128 000 tokens, permettant une meilleure compréhension des textes longs.
Le prix est très compétitif : 0,39 $ pour 1 million de tokens en entrée et 1,3 $ pour 1 million de tokens en sortie.
DeepSeek a une fois de plus relevé la barre dans l’intelligence artificielle avec la sortie de DeepSeek-V3-0324, un modèle de langage open source qui surpasse nettement ses prédécesseurs. Le modèle dépasse sans effort ses concurrents de premier plan comme GPT-4.5 et Claude 3.7 Sonnet.
Qu’est-ce que DeepSeek V3 0324 ?
Présentation de Deepseek V3 0324
| Informations de base | Date de sortie | 24 mars 2025 |
| Taille du modèle | 671B paramètres (37B actifs/token) | |
| Open source | Oui | |
| Architecture | Mixture-of-Experts (MoE) | |
| Capacité | Prend en charge les appels de fonctions | |
| Support linguistique | Langues multilingues prises en charge | Capacités améliorées en chinois |
| Multimodal | Capacité multimodale | Texte vers texte |
| Entraînement | Données d’entraînement | 14,8 billions de tokens diversifiés |
| Taille du modèle par précision | Type de tenseur | BF16/F8_E4M3/F32 |

Points forts de Deepseek V3 0324
Développement web front-end
- Exécutabilité améliorée du code :
- Suivez les bonnes pratiques comme l’utilisation de HTML sémantique, gardez le code propre et utilisez le contrôle de version pour garantir la lisibilité et la maintenabilité.
- Pages web et interfaces de jeu plus esthétiques :
- Utilisez le design responsive et des frameworks CSS (par exemple, Sass, Bootstrap) pour améliorer l’attrait visuel et la mise en page sur différents appareils.
Compétence en rédaction chinoise
- Amélioration du style et de la qualité du contenu :
- Étudiez et imitez des styles comme l’écriture élégante dans Lantingji Xu pour améliorer la fluidité et la grâce de l’écriture.
- Meilleure qualité dans les écrits de longueur moyenne à longue :
- Utilisez des structures comme « Qi, Cheng, Zhuan, He » (début, développement, rebondissement, conclusion) pour un flux clair et logique dans l’écriture.
Améliorations de fonctionnalités
- Réécriture interactive multi-tour améliorée :
- Développez des outils avec traitement du langage naturel pour prendre en charge les conversations multi-tours et améliorer l’interactivité.
- Qualité de traduction et rédaction de lettres optimisées :
- Utilisez des modèles d’apprentissage automatique comme DeepSeek pour améliorer la précision de la traduction et fournir des suggestions de style d’écriture pour les lettres.
Novita AI a introduit DeepSeek V3 0324, offrant un contexte plus long de 128 000 tokens et un prix incroyable (0,39 $ pour 1 million de tokens en entrée et 1,3 $ pour 1 million de tokens en sortie).
De plus, cette version prend entièrement en charge les appels de fonctions.
Vous pouvez commencer un essai gratuit sur Novita AI !
Utiliser DeepSeek V3 0324 localement
Configuration matérielle requise
| Modèle | VRAM du modèle | BESOINS GPU | Besoins GPU |
| Deepseek V3 0324 | ~1532 Go | 24Xh100(80*24 Go) | 1920 Go |
| Modèle 4 bits | ~386 Go | 8Xh100(80*24 Go) | 640 Go |
Ou vous pouvez prendre d’autres méthodes de bits :

source de unsloth
Guide étape par étape
Étape 1 : Obtenir et compiler llama.cpp
1.Clonez le dépôt et installez les dépendances :
<code>sudo apt-get update sudo apt-get install -y pciutils build-essential cmake curl libcurl4-openssl-dev git clone https://github.com/ggml-org/llama.cpp</code>
2.Compilez llama.cpp :
<code>make llama.cpp -B llama.cpp/build \ -DBUILD_SHARED_LIBS=OFF -DGGML_CUDA=ON -DLLAMA_CURL=ON</code>
3.Compilez les binaires :
<code>cmake --build llama.cpp/build --config Release -j --clean-first --target llama-quantize llama-cli llama-gguf-split cp llama.cpp/build/bin/llama-* llama.cpp</code>
Étape 2 : Télécharger le modèle
1.Installez les bibliothèques Python requises :
<code>pip install huggingface_hub hf_transfer</code>
2.Téléchargez le modèle GGUF DeepSeek-V3-0324 :
import os
from huggingface_hub import snapshot_download
os.environ["HF_HUB_ENABLE_HF_TRANSFER"] = "1"
snapshot_download(
repo_id="unsloth/DeepSeek-V3-0324-GGUF",
local_dir="unsloth/DeepSeek-V3-0324-GGUF",
allow_patterns=["*UD-Q2_K_XL*"] # Dynamic 2.7-bit (230GB)
)
Étape 3 : Exécuter le modèle
Ajustez les paramètres en fonction de votre matériel :
--threads : Nombre de threads CPU (par exemple, 32 pour les CPU à nombreux cœurs).
--ctx-size : Longueur du contexte (par exemple, 16384 pour une grande mémoire).
--n-gpu-layers : Nombre de couches déchargées sur le GPU. Augmentez pour de meilleures performances, mais réduisez si la mémoire GPU est insuffisante. Omettez cette option pour une inférence uniquement CPU.
Utiliser DeepSeek V3 0324 via l’API
Novita AI est une plateforme cloud IA qui offre aux développeurs un moyen simple de déployer des modèles IA via notre API simple, tout en fournissant un cloud GPU abordable et fiable pour la construction et le passage à l’échelle.
Étape 1 : Connectez-vous et accédez à la bibliothèque de modèles
Connectez-vous à votre compte et cliquez sur le bouton Bibliothèque de modèles.

Essayez la démo DeepSeek V3 0324 maintenant !
Étape 2 : Choisissez votre modèle
Parcourez les options disponibles et sélectionnez le modèle qui correspond à vos besoins.

Étape 3 : Commencez votre essai gratuit
Démarrez votre essai gratuit pour explorer les capacités du modèle sélectionné.

Étape 4 : Obtenez votre clé API
Pour vous authentifier avec l’API, nous vous fournirons une nouvelle clé API. En accédant à la page « Paramètres », vous pouvez copier la clé API comme indiqué sur l’image.

Étape 5 : Installez l’API
Installez l’API à l’aide du gestionnaire de paquets spécifique à votre langage de programmation.

Après l’installation, importez les bibliothèques nécessaires dans votre environnement de développement. Initialisez l’API avec votre clé API pour commencer à interagir avec Novita AI LLM. Voici un exemple d’utilisation de l’API de complétion de chat pour les utilisateurs Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<VOTRE CLÉ API Novita AI>",
)
model = "deepseek/deepseek-v3-0324"
stream = True # or False
max_tokens = 2048
system_content = """Soyez un assistant utile"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Salut !",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Utiliser DeepSeek V3 0324 via Chatbox
Étape 1 : Installez Chatbox

- Sélectionnez l’option « Paramètres ». Ce paramètre garantit la compatibilité avec les API suivant la norme OpenAI API, comme Novita AI.
- Remplissez les champs de configuration :
- URL de base : Saisissez
https://api.novita.ai/v3/openai. - Clé API : Collez ici votre clé API Novita AI.
- Nom du modèle : Collez le nom du modèle que vous avez copié précédemment (par exemple,
deepseek/deepseek-v3-0324).
- URL de base : Saisissez
- Une fois la configuration remplie, cliquez sur Terminé.
Utiliser DeepSeek V3 0324 via un GPU cloud
Étape 1 : Créez un compte
Si vous êtes nouveau sur Novita AI, commencez par créer un compte sur notre site web. Une fois inscrit, rendez-vous dans l’onglet « GPUs » pour explorer les ressources disponibles et commencer votre parcours.

Étape 2 : Explorez les modèles et les serveurs GPU
Commencez par sélectionner un modèle qui correspond aux besoins de votre projet, comme PyTorch, TensorFlow ou CUDA. Choisissez la version qui correspond à vos exigences, par exemple PyTorch 2.2.1 ou CUDA 11.8.0. Sélectionnez ensuite la configuration de serveur GPU A100, qui offre des performances puissantes pour gérer des charges de travail exigeantes avec une VRAM, une RAM et une capacité de disque suffisantes.

Essayez les GPU haute performance de Novita AI
Étape 3 : Personnalisez votre déploiement
Après avoir sélectionné un modèle et un GPU, personnalisez vos paramètres de déploiement en ajustant des paramètres comme la version du système d’exploitation (par exemple, CUDA 11.8). Vous pouvez également modifier d’autres configurations pour adapter l’environnement aux exigences spécifiques de votre projet.

Étape 4 : Lancez une instance
Une fois que vous avez finalisé le modèle et les paramètres de déploiement, cliquez sur « Lancer l’instance » pour configurer votre instance GPU. Cela démarrera la configuration de l’environnement, vous permettant de commencer à utiliser les ressources GPU pour vos tâches IA.

Novita AI s’intègre à 15 plateformes
Novita AI s’est intégré à 15 plateformes, et des tutoriels détaillés sont disponibles dans la documentation.

Vérifiez si votre intégration d’application est terminée ?
DeepSeek V3 0324 représente une avancée significative dans les capacités de l’IA, offrant des performances élevées avec une structure de prix abordable. Ses capacités multilingues, sa fenêtre de contexte étendue et son support des appels de fonctions en font un outil polyvalent pour les développeurs. Que ce soit en local ou via l’API Novita AI, DeepSeek V3 0324 fournit une solution puissante pour une variété de tâches IA, allant du traitement du langage naturel aux applications multimodales.
Questions fréquemment posées
Quel est le prix de DeepSeek V3 0324 ?
Le prix est de 0,39 $ pour 1 million de tokens en entrée et 1,3 $ pour 1 million de tokens en sortie, ce qui le rend économique pour les développeurs sur Novita AI.
De quel matériel ai-je besoin pour exécuter DeepSeek V3 0324 localement ?
Le modèle nécessite des ressources matérielles importantes, notamment environ 1532 Go de VRAM et 24 GPU H100 de 80 Go chacun, soit un total de 1920 Go.
DeepSeek V3 0324 prend-il en charge les appels de fonctions ?
Oui, il prend entièrement en charge les appels de fonctions, permettant aux développeurs de l’intégrer dans des workflows plus complexes.
Novita AI est une plateforme cloud IA qui offre aux développeurs un moyen simple de déployer des modèles IA via notre API simple, tout en fournissant un cloud GPU abordable et fiable pour la construction et le passage à l’échelle.

