Comment accéder à Deepseek V3 0324 en 4 méthodes ?

Comment accéder à Deepseek V3 0324 en 4 méthodes ?

Points clés

DeepSeek V3 0324 apporte des améliorations substantielles dans le raisonnement logique, la résolution de problèmes mathématiques, la précision des appels de fonctions et la maîtrise des langues spécialisées.

Vous pouvez commencer un essai gratuit sur Novita AI !

Un point fort majeur est la fenêtre de contexte étendue de 128 000 tokens, permettant une meilleure compréhension des textes longs.
Le prix est très compétitif : 0,39 $ pour 1 million de tokens en entrée et 1,3 $ pour 1 million de tokens en sortie.

DeepSeek a une fois de plus relevé la barre dans l’intelligence artificielle avec la sortie de DeepSeek-V3-0324, un modèle de langage open source qui surpasse nettement ses prédécesseurs. Le modèle dépasse sans effort ses concurrents de premier plan comme GPT-4.5 et Claude 3.7 Sonnet.

Qu’est-ce que DeepSeek V3 0324 ?

Présentation de Deepseek V3 0324

Informations de base Date de sortie 24 mars 2025
Taille du modèle 671B paramètres (37B actifs/token)
Open source Oui
Architecture Mixture-of-Experts (MoE)
Capacité Prend en charge les appels de fonctions
Support linguistique Langues multilingues prises en charge Capacités améliorées en chinois
Multimodal Capacité multimodale Texte vers texte
Entraînement Données d’entraînement 14,8 billions de tokens diversifiés
Taille du modèle par précision Type de tenseur BF16/F8_E4M3/F32

DEEPSEEK V3 0324

Points forts de Deepseek V3 0324

Développement web front-end

  • Exécutabilité améliorée du code :
    • Suivez les bonnes pratiques comme l’utilisation de HTML sémantique, gardez le code propre et utilisez le contrôle de version pour garantir la lisibilité et la maintenabilité.
  • Pages web et interfaces de jeu plus esthétiques :
    • Utilisez le design responsive et des frameworks CSS (par exemple, Sass, Bootstrap) pour améliorer l’attrait visuel et la mise en page sur différents appareils.

Compétence en rédaction chinoise

  • Amélioration du style et de la qualité du contenu :
    • Étudiez et imitez des styles comme l’écriture élégante dans Lantingji Xu pour améliorer la fluidité et la grâce de l’écriture.
  • Meilleure qualité dans les écrits de longueur moyenne à longue :
    • Utilisez des structures comme « Qi, Cheng, Zhuan, He » (début, développement, rebondissement, conclusion) pour un flux clair et logique dans l’écriture.

Améliorations de fonctionnalités

  • Réécriture interactive multi-tour améliorée :
    • Développez des outils avec traitement du langage naturel pour prendre en charge les conversations multi-tours et améliorer l’interactivité.
  • Qualité de traduction et rédaction de lettres optimisées :
    • Utilisez des modèles d’apprentissage automatique comme DeepSeek pour améliorer la précision de la traduction et fournir des suggestions de style d’écriture pour les lettres.

Novita AI a introduit DeepSeek V3 0324, offrant un contexte plus long de 128 000 tokens et un prix incroyable (0,39 $ pour 1 million de tokens en entrée et 1,3 $ pour 1 million de tokens en sortie).

De plus, cette version prend entièrement en charge les appels de fonctions.

Vous pouvez commencer un essai gratuit sur Novita AI !

deepseek v3 0324 sur novita ai

Utiliser DeepSeek V3 0324 localement

Configuration matérielle requise

Modèle VRAM du modèle BESOINS GPU Besoins GPU
Deepseek V3 0324 ~1532 Go 24Xh100(80*24 Go) 1920 Go
Modèle 4 bits ~386 Go 8Xh100(80*24 Go) 640 Go

Ou vous pouvez prendre d’autres méthodes de bits :

bits de deepseek v3 0324

source de unsloth

Guide étape par étape

Étape 1 : Obtenir et compiler llama.cpp

1.Clonez le dépôt et installez les dépendances :

<code>sudo apt-get update sudo apt-get install -y pciutils build-essential cmake curl libcurl4-openssl-dev git clone https://github.com/ggml-org/llama.cpp</code>

2.Compilez llama.cpp :

<code>make llama.cpp -B llama.cpp/build \ -DBUILD_SHARED_LIBS=OFF -DGGML_CUDA=ON -DLLAMA_CURL=ON</code>

3.Compilez les binaires :

<code>cmake --build llama.cpp/build --config Release -j --clean-first --target llama-quantize llama-cli llama-gguf-split cp llama.cpp/build/bin/llama-* llama.cpp</code>

Étape 2 : Télécharger le modèle

1.Installez les bibliothèques Python requises :

<code>pip install huggingface_hub hf_transfer</code>

2.Téléchargez le modèle GGUF DeepSeek-V3-0324 :

import os
from huggingface_hub import snapshot_download

os.environ["HF_HUB_ENABLE_HF_TRANSFER"] = "1"
snapshot_download(
    repo_id="unsloth/DeepSeek-V3-0324-GGUF",
    local_dir="unsloth/DeepSeek-V3-0324-GGUF",
    allow_patterns=["*UD-Q2_K_XL*"]  # Dynamic 2.7-bit (230GB)
)

Étape 3 : Exécuter le modèle

Ajustez les paramètres en fonction de votre matériel :

--threads : Nombre de threads CPU (par exemple, 32 pour les CPU à nombreux cœurs).

--ctx-size : Longueur du contexte (par exemple, 16384 pour une grande mémoire).

--n-gpu-layers : Nombre de couches déchargées sur le GPU. Augmentez pour de meilleures performances, mais réduisez si la mémoire GPU est insuffisante. Omettez cette option pour une inférence uniquement CPU.

Utiliser DeepSeek V3 0324 via l’API

Novita AI est une plateforme cloud IA qui offre aux développeurs un moyen simple de déployer des modèles IA via notre API simple, tout en fournissant un cloud GPU abordable et fiable pour la construction et le passage à l’échelle.

Étape 1 : Connectez-vous et accédez à la bibliothèque de modèles

Connectez-vous à votre compte et cliquez sur le bouton Bibliothèque de modèles.

Connectez-vous et accédez à la bibliothèque de modèles

Essayez la démo DeepSeek V3 0324 maintenant !

Étape 2 : Choisissez votre modèle

Parcourez les options disponibles et sélectionnez le modèle qui correspond à vos besoins.

choisissez votre modèle

Étape 3 : Commencez votre essai gratuit

Démarrez votre essai gratuit pour explorer les capacités du modèle sélectionné.

commencez un essai gratuit

Étape 4 : Obtenez votre clé API

Pour vous authentifier avec l’API, nous vous fournirons une nouvelle clé API. En accédant à la page « Paramètres », vous pouvez copier la clé API comme indiqué sur l’image.

obtenez la clé api

Étape 5 : Installez l’API

Installez l’API à l’aide du gestionnaire de paquets spécifique à votre langage de programmation.

installez l’api

Après l’installation, importez les bibliothèques nécessaires dans votre environnement de développement. Initialisez l’API avec votre clé API pour commencer à interagir avec Novita AI LLM. Voici un exemple d’utilisation de l’API de complétion de chat pour les utilisateurs Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<VOTRE CLÉ API Novita AI>",
)

model = "deepseek/deepseek-v3-0324"
stream = True # or False
max_tokens = 2048
system_content = """Soyez un assistant utile"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Salut !",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

Utiliser DeepSeek V3 0324 via Chatbox

Étape 1 : Installez Chatbox

deepseek v3 chatbox

  1. Sélectionnez l’option « Paramètres ». Ce paramètre garantit la compatibilité avec les API suivant la norme OpenAI API, comme Novita AI.
  2. Remplissez les champs de configuration :
    • URL de base : Saisissez https://api.novita.ai/v3/openai.
    • Clé API : Collez ici votre clé API Novita AI.
    • Nom du modèle : Collez le nom du modèle que vous avez copié précédemment (par exemple, deepseek/deepseek-v3-0324).
  3. Une fois la configuration remplie, cliquez sur Terminé.

Utiliser DeepSeek V3 0324 via un GPU cloud

Étape 1 : Créez un compte

Si vous êtes nouveau sur Novita AI, commencez par créer un compte sur notre site web. Une fois inscrit, rendez-vous dans l’onglet « GPUs » pour explorer les ressources disponibles et commencer votre parcours.

capture d’écran du site Novita AI

Étape 2 : Explorez les modèles et les serveurs GPU

Commencez par sélectionner un modèle qui correspond aux besoins de votre projet, comme PyTorch, TensorFlow ou CUDA. Choisissez la version qui correspond à vos exigences, par exemple PyTorch 2.2.1 ou CUDA 11.8.0. Sélectionnez ensuite la configuration de serveur GPU A100, qui offre des performances puissantes pour gérer des charges de travail exigeantes avec une VRAM, une RAM et une capacité de disque suffisantes.

capture d’écran du site novita ai utilisant un gpu cloud

Essayez les GPU haute performance de Novita AI

Étape 3 : Personnalisez votre déploiement

Après avoir sélectionné un modèle et un GPU, personnalisez vos paramètres de déploiement en ajustant des paramètres comme la version du système d’exploitation (par exemple, CUDA 11.8). Vous pouvez également modifier d’autres configurations pour adapter l’environnement aux exigences spécifiques de votre projet.

capture d’écran du site novita ai utilisant un gpu cloud

Étape 4 : Lancez une instance

Une fois que vous avez finalisé le modèle et les paramètres de déploiement, cliquez sur « Lancer l’instance » pour configurer votre instance GPU. Cela démarrera la configuration de l’environnement, vous permettant de commencer à utiliser les ressources GPU pour vos tâches IA.

capture d’écran du site novita ai utilisant un gpu cloud

Novita AI s’intègre à 15 plateformes

Novita AI s’est intégré à 15 plateformes, et des tutoriels détaillés sont disponibles dans la documentation.

Novita AI s’intègre à 15 plateformes

Vérifiez si votre intégration d’application est terminée ?

DeepSeek V3 0324 représente une avancée significative dans les capacités de l’IA, offrant des performances élevées avec une structure de prix abordable. Ses capacités multilingues, sa fenêtre de contexte étendue et son support des appels de fonctions en font un outil polyvalent pour les développeurs. Que ce soit en local ou via l’API Novita AI, DeepSeek V3 0324 fournit une solution puissante pour une variété de tâches IA, allant du traitement du langage naturel aux applications multimodales.

Questions fréquemment posées

Quel est le prix de DeepSeek V3 0324 ?

Le prix est de 0,39 $ pour 1 million de tokens en entrée et 1,3 $ pour 1 million de tokens en sortie, ce qui le rend économique pour les développeurs sur Novita AI.

De quel matériel ai-je besoin pour exécuter DeepSeek V3 0324 localement ?

Le modèle nécessite des ressources matérielles importantes, notamment environ 1532 Go de VRAM et 24 GPU H100 de 80 Go chacun, soit un total de 1920 Go.

DeepSeek V3 0324 prend-il en charge les appels de fonctions ?

Oui, il prend entièrement en charge les appels de fonctions, permettant aux développeurs de l’intégrer dans des workflows plus complexes.

Novita AI est une plateforme cloud IA qui offre aux développeurs un moyen simple de déployer des modèles IA via notre API simple, tout en fournissant un cloud GPU abordable et fiable pour la construction et le passage à l’échelle.

Lectures recommandées