Découvrez la prochaine génération de développement IA avec la dernière intégration des modèles Llama 3.2 de Meta sur Novita AI. Notre plateforme propose désormais une suite complète de modèles conçus pour répondre à divers besoins de développement, tout en maintenant un rapport coût-efficacité et des performances supérieures.
Nouveautés de Llama 3.2
|||||||
1) Entrée multimodale dans les modèles 11B et 90B

Source de Meta
- Compréhension d’images : Reconnaît les objets, les scènes et les dessins, avec des capacités OCR.
- Légendage et questions-réponses : Génère des légendes et répond aux questions basées sur le contenu visuel.
- Raisonnement visuel : Analyse des équations, des diagrammes et des documents pour un raisonnement visuel amélioré.
2) Tailles plus petites dans les modèles textuels 1B et 3B
- Nouveaux cas d’utilisation SLM (Small Language Model) :
- Résumé sur appareil
- Écriture et traduction
- Questions-réponses multilingues
Modèles Llama 3.2 disponibles sur Novita AI

Novita AI propose fièrement trois variantes puissantes de Llama 3.2, chacune optimisée pour différents cas d’usage :
Llama 3.2 1B Instruct : votre porte d’entrée vers une IA efficace
Transformez votre flux de travail de développement avec notre modèle le plus accessible, doté d’une impressionnante fenêtre de contexte de 131 000 tokens. À seulement 0,02 $/M tokens, ce modèle offre une valeur exceptionnelle pour le prototypage rapide et les applications légères. Essayez Llama 3.2 1B Instruct maintenant
Llama 3.2 3B Instruct : puissance et performance
Débloquez des capacités de raisonnement améliorées avec notre modèle de milieu de gamme, offrant une longueur de contexte de 32 768 tokens. Avec des prix compétitifs à 0,03 $/M tokens d’entrée et 0,05 $/M tokens de sortie, il est parfaitement positionné pour les applications à moyenne échelle nécessitant des performances robustes. Essayez Llama 3.2 3B Instruct maintenant
Llama 3.2 11B Vision Instruct : l’excellence multimodale
Découvrez un traitement multimodal de pointe avec notre modèle de vision avancé. Supportant une longueur de contexte de 131 000 tokens à 0,06 $/M tokens, il excelle dans les tâches visuo-linguistiques complexes. Essayez Llama 3.2 11B Vision Instruct maintenant
Faire progresser l’IA multimodale avec une base open source

Application du modèle Llama 3.2
Les modèles de vision Llama 3.2, avec 11 milliards et 90 milliards de paramètres, offrent des capacités multimodales robustes pour traiter des images et du texte. Intégrés à la plateforme Novita AI, cette combinaison peut débloquer des applications concrètes importantes telles que :
Cas d’usage multimodaux
- Agents interactifs : Développez des agents IA capables de répondre à la fois aux entrées textuelles et visuelles, offrant une expérience utilisateur améliorée.
- Légendage d’images : Créez des descriptions d’images de haute qualité pour le commerce électronique, la création de contenu et l’accessibilité numérique.
- Recherche visuelle : Permettez aux utilisateurs d’effectuer des recherches à l’aide d’images, améliorant l’efficacité des recherches dans le commerce électronique et la vente au détail.
- Intelligence documentaire : Analysez des documents contenant à la fois du texte et des visuels, tels que des contrats juridiques et des rapports financiers.
Applications sectorielles
Les points d’accès Llama 3.2 de Novita AI ouvrent de nouvelles possibilités dans divers secteurs :
- Santé : Améliorez l’analyse d’images médicales pour une meilleure précision diagnostique et des soins optimisés.
- Vente au détail et e-commerce : Transformez l’expérience d’achat avec des recherches par image et texte et des recommandations personnalisées.
- Finance et juridique : Rationalisez les flux de travail en analysant le contenu graphique et textuel, optimisant la révision des contrats et les audits.
- Éducation et formation : Développez des outils éducatifs interactifs qui traitent à la fois le texte et les visuels pour améliorer l’engagement.
Premiers pas : votre parcours avec Novita AI
Étape 1 : Choisissez votre modèle

Choisissez en fonction de vos besoins spécifiques :
- Pour le prototypage : Visitez notre Démo Llama 3.2 1B Instruct pour des tests initiaux.
- Pour les applications en production : Expérimentez avec le modèle Llama 3.2 3B Instruct pour des capacités renforcées.
- Pour les tâches visuo-linguistiques : Testez les fonctionnalités multimodales dans notre Démo Llama 3.2 11B Vision Instruct.
Ou utilisez notre SDK Python pour intégrer rapidement les modèles Llama dans vos applications :
Étape 2 : Intégrez et déployez
Suivez notre procédure d’intégration simple :
- Inscrivez-vous pour un compte Novita AI.
- Accédez à notre documentation complète de l’API LLM.
- Implémentez les appels API dans votre langage de programmation préféré.
- Testez minutieusement dans votre environnement de développement.
Exemple avec client Python
from openai import OpenAI
client = OpenAI(base_url="https://api.novita.ai/v3/openai",api_key="Votre clé API",
)
model = "meta-llama/llama-3.2-11b-vision-instruct"stream = True # ou Falsemax_tokens = 65500system_content = "Soyez un assistant utile"temperature = 1top_p = 1min_p = 0top_k = 50presence_penalty = 0frequency_penalty = 0repetition_penalty = 1response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(model=model,messages=[
{"role": "system","content": system_content,
},
{"role": "user","content": "Bonjour !",
}
],stream=stream,max_tokens=max_tokens,temperature=temperature,top_p=top_p,presence_penalty=presence_penalty,frequency_penalty=frequency_penalty,response_format=response_format,extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Exemple avec client JavaScript
import OpenAI from "openai";
const openai = new OpenAI({
baseURL: "https://api.novita.ai/v3/openai",
apiKey: "Votre clé API",
});
const stream = true; // ou false
async function run() {
const completion = await openai.chat.completions.create({
messages: [
{
role: "system",
content: "Soyez un assistant utile",
},
{
role: "user",
content: "Bonjour !",
},
],
model: "meta-llama/llama-3.2-3b-instruct",
stream,
response_format: { type: "text" },
max_tokens: 16384,
temperature: 1,
top_p: 1,
min_p: 0,
top_k: 50,
presence_penalty: 0,
frequency_penalty: 0,
repetition_penalty: 1
});
if (stream) {
for await (const chunk of completion) {
if (chunk.choices[0].finish_reason) {
console.log(chunk.choices[0].finish_reason);
} else {
console.log(chunk.choices[0].delta.content);
}
}
} else {
console.log(JSON.stringify(completion));
}
}
run();
Exemple avec client Curl
curl "https://api.novita.ai/v3/openai/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer Votre clé API" \
-d @- << 'EOF'
{
"model": "meta-llama/llama-3.2-3b-instruct",
"messages": [
{
"role": "system",
"content": "Soyez un assistant utile"
},
{
"role": "user",
"content": "Bonjour !"
}
],
"response_format": { "type": "text" },
"max_tokens": 16384,
"temperature": 1,
"top_p": 1,
"min_p": 0,
"top_k": 50,
"presence_penalty": 0,
"frequency_penalty": 0,
"repetition_penalty": 1
}
EOF
Étape 3 : Optimisez et passez à l’échelle
Maximisez votre implémentation :
- Surveillez l’utilisation des tokens et les coûts.
- Affinez vos invites pour une meilleure efficacité.
- Faites évoluer votre application en fonction des besoins de performance.
- Utilisez les capacités étendues de la longueur du contexte.
Prêt à transformer votre développement IA ?
Visitez Novita AI dès aujourd’hui pour commencer à construire avec Llama 3.2. Notre équipe est prête à vous accompagner de l’expérimentation au déploiement en production, en veillant à ce que vous tiriez le meilleur parti de ces modèles puissants.
Publié à l’origine sur Novita AI
Novita AI est la plateforme cloud tout-en-un qui donne vie à vos ambitions IA. APIs intégrées, serverless, instances GPU — les outils rentables dont vous avez besoin. Éliminez l’infrastructure, commencez gratuitement, et réalisez votre vision IA.
Lectures recommandées
