Les modèles Llama 3.2 désormais disponibles sur Novita AI

Les modèles Llama 3.2 désormais disponibles sur Novita AI

Découvrez la prochaine génération de développement IA avec la dernière intégration des modèles Llama 3.2 de Meta sur Novita AI. Notre plateforme propose désormais une suite complète de modèles conçus pour répondre à divers besoins de développement, tout en maintenant un rapport coût-efficacité et des performances supérieures.

Nouveautés de Llama 3.2

|||||||

|---|---|---|---|---|---| ||Llama 2.0 (7B, 13B, 70B)|Llama 3.0 (8B, 70B)|Llama 3.1 (8B, 70B, 405B)|Llama 3.2 Multimodal (11B & 90B)|Llama 3.2 Lightweight Text Only (1B & 3B)| |Date de sortie|18 juillet 2023|18 avril 2024|23 juillet 2024|25 sept. 2024|25 sept. 2024| |Fenêtre de contexte|4K|8K|128K|128K|128K| |Taille du vocabulaire|32K|128K|128K|128K|128K| |Multilingue officiel|Anglais uniquement|Anglais uniquement|8 langues|8 langues|8 langues| |Appel d'outils|Non|Non|Oui|Oui|Oui| |Date limite des connaissances|Sept. 2022|2023, Mars (8B) Déc. (70B)|Déc. 2023|Déc. 2023|Déc. 2023|

1) Entrée multimodale dans les modèles 11B et 90B

Illustration de l'approche compositionnelle pour ajouter des capacités multimodales à Llama 3

Source de Meta

  • Compréhension d’images : Reconnaît les objets, les scènes et les dessins, avec des capacités OCR.
  • Légendage et questions-réponses : Génère des légendes et répond aux questions basées sur le contenu visuel.
  • Raisonnement visuel : Analyse des équations, des diagrammes et des documents pour un raisonnement visuel amélioré.

2) Tailles plus petites dans les modèles textuels 1B et 3B

  • Nouveaux cas d’utilisation SLM (Small Language Model) :
    • Résumé sur appareil
    • Écriture et traduction
    • Questions-réponses multilingues

Modèles Llama 3.2 disponibles sur Novita AI

Capture d'écran du modèle Llama 3.2 sur Novita AI

Novita AI propose fièrement trois variantes puissantes de Llama 3.2, chacune optimisée pour différents cas d’usage :

Llama 3.2 1B Instruct : votre porte d’entrée vers une IA efficace

Transformez votre flux de travail de développement avec notre modèle le plus accessible, doté d’une impressionnante fenêtre de contexte de 131 000 tokens. À seulement 0,02 $/M tokens, ce modèle offre une valeur exceptionnelle pour le prototypage rapide et les applications légères. Essayez Llama 3.2 1B Instruct maintenant

Llama 3.2 3B Instruct : puissance et performance

Débloquez des capacités de raisonnement améliorées avec notre modèle de milieu de gamme, offrant une longueur de contexte de 32 768 tokens. Avec des prix compétitifs à 0,03 $/M tokens d’entrée et 0,05 $/M tokens de sortie, il est parfaitement positionné pour les applications à moyenne échelle nécessitant des performances robustes. Essayez Llama 3.2 3B Instruct maintenant

Llama 3.2 11B Vision Instruct : l’excellence multimodale

Découvrez un traitement multimodal de pointe avec notre modèle de vision avancé. Supportant une longueur de contexte de 131 000 tokens à 0,06 $/M tokens, il excelle dans les tâches visuo-linguistiques complexes. Essayez Llama 3.2 11B Vision Instruct maintenant

Faire progresser l’IA multimodale avec une base open source

Application du modèle Llama 3.2

Les modèles de vision Llama 3.2, avec 11 milliards et 90 milliards de paramètres, offrent des capacités multimodales robustes pour traiter des images et du texte. Intégrés à la plateforme Novita AI, cette combinaison peut débloquer des applications concrètes importantes telles que :

Cas d’usage multimodaux

  • Agents interactifs : Développez des agents IA capables de répondre à la fois aux entrées textuelles et visuelles, offrant une expérience utilisateur améliorée.
  • Légendage d’images : Créez des descriptions d’images de haute qualité pour le commerce électronique, la création de contenu et l’accessibilité numérique.
  • Recherche visuelle : Permettez aux utilisateurs d’effectuer des recherches à l’aide d’images, améliorant l’efficacité des recherches dans le commerce électronique et la vente au détail.
  • Intelligence documentaire : Analysez des documents contenant à la fois du texte et des visuels, tels que des contrats juridiques et des rapports financiers.

Applications sectorielles

Les points d’accès Llama 3.2 de Novita AI ouvrent de nouvelles possibilités dans divers secteurs :

  • Santé : Améliorez l’analyse d’images médicales pour une meilleure précision diagnostique et des soins optimisés.
  • Vente au détail et e-commerce : Transformez l’expérience d’achat avec des recherches par image et texte et des recommandations personnalisées.
  • Finance et juridique : Rationalisez les flux de travail en analysant le contenu graphique et textuel, optimisant la révision des contrats et les audits.
  • Éducation et formation : Développez des outils éducatifs interactifs qui traitent à la fois le texte et les visuels pour améliorer l’engagement.

Premiers pas : votre parcours avec Novita AI

Étape 1 : Choisissez votre modèle

Playground Llama 3.2 1b

Choisissez en fonction de vos besoins spécifiques :

Ou utilisez notre SDK Python pour intégrer rapidement les modèles Llama dans vos applications :

Étape 2 : Intégrez et déployez

Suivez notre procédure d’intégration simple :

  1. Inscrivez-vous pour un compte Novita AI.
  2. Accédez à notre documentation complète de l’API LLM.
  3. Implémentez les appels API dans votre langage de programmation préféré.
  4. Testez minutieusement dans votre environnement de développement.

Exemple avec client Python

from openai import OpenAI

client = OpenAI(base_url="https://api.novita.ai/v3/openai",api_key="Votre clé API",
)

model = "meta-llama/llama-3.2-11b-vision-instruct"stream = True  # ou Falsemax_tokens = 65500system_content = "Soyez un assistant utile"temperature = 1top_p = 1min_p = 0top_k = 50presence_penalty = 0frequency_penalty = 0repetition_penalty = 1response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(model=model,messages=[
        {"role": "system","content": system_content,
        },
        {"role": "user","content": "Bonjour !",
        }
    ],stream=stream,max_tokens=max_tokens,temperature=temperature,top_p=top_p,presence_penalty=presence_penalty,frequency_penalty=frequency_penalty,response_format=response_format,extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
)
if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Exemple avec client JavaScript

import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.novita.ai/v3/openai",
  apiKey: "Votre clé API",
});
const stream = true; // ou false

async function run() {
  const completion = await openai.chat.completions.create({
    messages: [
      {
        role: "system",
        content: "Soyez un assistant utile",
      },
      {
        role: "user",
        content: "Bonjour !",
      },
    ],
    model: "meta-llama/llama-3.2-3b-instruct",
    stream,
    response_format: { type: "text" },
    max_tokens: 16384,
    temperature: 1,
    top_p: 1,
    min_p: 0,
    top_k: 50,
    presence_penalty: 0,
    frequency_penalty: 0,
    repetition_penalty: 1
  });

  if (stream) {
    for await (const chunk of completion) {
      if (chunk.choices[0].finish_reason) {
        console.log(chunk.choices[0].finish_reason);
      } else {
        console.log(chunk.choices[0].delta.content);
      }
    }
  } else {
    console.log(JSON.stringify(completion));
  }
}

run();
  

Exemple avec client Curl

curl "https://api.novita.ai/v3/openai/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer Votre clé API" \
  -d @- << 'EOF'
{
    "model": "meta-llama/llama-3.2-3b-instruct",
    "messages": [
        {
            "role": "system",
            "content": "Soyez un assistant utile"
        },
        {
            "role": "user",
            "content": "Bonjour !"
        }
    ],
    "response_format": { "type": "text" },
    "max_tokens": 16384,
    "temperature": 1,
    "top_p": 1,
    "min_p": 0,
    "top_k": 50,
    "presence_penalty": 0,
    "frequency_penalty": 0,
    "repetition_penalty": 1
}
EOF
  

Étape 3 : Optimisez et passez à l’échelle

Maximisez votre implémentation :

  • Surveillez l’utilisation des tokens et les coûts.
  • Affinez vos invites pour une meilleure efficacité.
  • Faites évoluer votre application en fonction des besoins de performance.
  • Utilisez les capacités étendues de la longueur du contexte.

Prêt à transformer votre développement IA ?

Visitez Novita AI dès aujourd’hui pour commencer à construire avec Llama 3.2. Notre équipe est prête à vous accompagner de l’expérimentation au déploiement en production, en veillant à ce que vous tiriez le meilleur parti de ces modèles puissants.

Publié à l’origine sur Novita AI

Novita AI est la plateforme cloud tout-en-un qui donne vie à vos ambitions IA. APIs intégrées, serverless, instances GPU — les outils rentables dont vous avez besoin. Éliminez l’infrastructure, commencez gratuitement, et réalisez votre vision IA.

Lectures recommandées

  1. Llama 3.2 vs GPT-4o : choisir le bon modèle IA
  2. Comment accéder à Llama 3.2 : simplifier votre processus de développement IA
  3. Llama 3.2 Vision : libérer la puissance de l’IA open source multimodale