Construire des agents autonomes avec Smolagents et Novita AI
By
Novita AI
/ le 13 avril 2025 / LLM / 6 minutes de lecture
Points clés
1. Agent IA : Permet une prise de décision autonome au-delà des flux de travail rigides et prédéfinis. Exploite le raisonnement itératif, l’exécution adaptative et l’apprentissage continu.
2. Agents smolaires : Bibliothèque Python légère (~1,000 XNUMX lignes), simplifiant la création d'agents IA. Génère directement des extraits de code Python exploitables exécutés en toute sécurité dans des environnements sandbox. Prend en charge divers modèles, modalités (texte, images, audio, vidéo) et intégration d'outils externes.
3. Novita AI Assistance: Compatible avec Smolagents, prenant en charge des modèles puissants comme DeepSeek R1 Turbo avec des performances et un prix abordable améliorés.
L'intelligence artificielle a évolué, passant de la reconnaissance de modèles à la génération de contenu créatif. La prochaine étape importante est l'émergence de l'IA agentique, des systèmes capables de prendre des décisions et d'agir de manière autonome pour résoudre des problèmes complexes en plusieurs étapes. Cet article explore le concept d'agents IA, examine les spécificités des agents de code, décrit leur conception, analyse les performances des différents modèles sous-jacents et répond aux questions fréquentes sur cette technologie transformatrice.
L'IA agentique répond aux défis posés par les tâches que les workflows traditionnels et rigides peinent à gérer efficacement. De nombreux scénarios réels impliquent des processus complexes et nuancés qui ne peuvent être pleinement appréhendés par des structures statiques et prédéfinies de type « if-else ». L'IA agentique apporte flexibilité et adaptabilité aux workflows, permettant aux systèmes de déterminer et d'exécuter dynamiquement la séquence d'actions optimale en fonction de l'évolution du contexte.
Comment ça marche?
L'IA agentique fonctionne selon une boucle itérative et dynamique de perception, de raisonnement, d'action et d'apprentissage. Fondamentalement, les agents IA utilisent de grands modèles de langage (MLM).LLMs) comme moteurs de raisonnement pour analyser les situations, planifier les réponses, coordonner des modèles spécialisés et exécuter des tâches. Le flux de travail comprend généralement les étapes suivantes :
Ingestion et perception des données : Les agents collectent et traitent des données provenant de sources multiples, acquérant ainsi une connaissance contextuelle pour éclairer leurs processus de prise de décision.
Raisonnement et planification : L'utilisation de LLMs, les agents interprètent les données, raisonnent sur des solutions possibles, génèrent des plans stratégiques et déterminent les actions nécessaires pour atteindre leurs objectifs.
Action et exécution : Les agents s'intègrent à des outils externes et à des fonctions prédéfinies, exécutant des tâches en fonction de leurs résultats de raisonnement. Ils effectuent des actions de manière itérative, observent les résultats et s'adaptent en conséquence jusqu'à obtenir le résultat souhaité.
Apprentissage continu Grâce à des boucles de rétroaction et à des techniques telles que la génération augmentée de récupération (RAG), les agents accèdent à des sources de données propriétaires, affinent leur compréhension et améliorent continuellement leurs performances, leur précision et leur pertinence.
En combinant ces capacités (prise de décision autonome, raisonnement itératif, intégration d'outils externes et amélioration continue), l'IA agentique comble efficacement les lacunes LLMRaisonnement basé sur des données avec exécution et adaptation dans le monde réel.
Smolagents est une bibliothèque Python légère conçue pour simplifier la création d'agents d'IA puissants. Grâce à une approche minimaliste, sa logique de base tient dans environ 1,000 XNUMX lignes de code, offrant un minimum d'abstractions et un contrôle direct accru pour les développeurs. Smolagents se positionne comme le successeur de transformers.agents, qui sera finalement obsolète. Pour en savoir plus, rendez-vous sur github!
Fonctionnalités clés et mécanisme clé
✨ Simplicité
Smolagents implémente une puissante logique d'agent d'IA dans environ 1,000 XNUMX lignes de code, en gardant les abstractions minimales pour une plus grande flexibilité du développeur (voir agents.py).
🧑💻 Assistance de premier ordre par agent de code
CodeAgent de Smolagents génère directement les actions des agents sous forme d'extraits de code Python plutôt que de JSON ou de texte, améliorant ainsi l'efficacité et les performances. Il exécute le code en toute sécurité dans des environnements sandbox (E2B, Docker) et prend en charge les agents traditionnels basés sur JSON/texte.
🤗 Intégrations Hub
Smolagents permet de partager et de charger facilement des outils réutilisables basés sur Python via Hugging Face Hub, simplifiant ainsi la collaboration et la réutilisation des outils.
🌐 Indépendant du modèle
Smolagents prend en charge pratiquement tous les grands modèles de langage (LLM) — transformateurs locaux ou modèles ollama, modèles hébergés par Hugging Face et fournisseurs externes comme OpenAI ou Anthropic via LiteLLM.
👁️ Indépendant des modalités
Les agents créés avec Smolagents peuvent gérer de manière transparente diverses modalités de saisie, notamment du texte, des images, des vidéos et de l'audio.
🛠️ Indépendant des outils
Smolagents intègre de manière flexible des outils de divers écosystèmes, tels que LangChain, MCP d'Anthropic ou Hugging Face Hub Spaces.
Comment créer un agent en utilisant smolagents avec Novita AI API ?
Novita AI est une plateforme cloud d'IA qui offre aux développeurs un moyen simple de déployer des modèles d'IA à l'aide de notre API simple, tout en fournissant une solution abordable et fiable GPU Cloud pour la construction et la mise à l'échelle.
Smolagents prend en charge divers modèles de langage volumineux (LLMs), y compris Novita AI! Ensuite, nous utiliserons le deepseek r1 turbo comme exemple pour montrer la puissance des smolaents et Novita AI!
Significativement, Novita AI lance une version Turbo avec un débit 3x et une remise limitée de 60 % !
importer le système d'exploitation depuis smolagents importer OpenAIServerModel, CodeAgent, DuckDuckGoSearchTool modèle = OpenAIServerModel( model_id="deepseek/deepseek-r1-turbo", api_base="https://api.novita.ai/v3/openai", api_key="Votre clé API" # Basculez vers la clé API du serveur que vous ciblez. ) agent = CodeAgent(tools=[DuckDuckGoSearchTool()], model=model) agent.run("Veuillez planifier un week-end de voyage de Shanghai à Pékin, y compris les options de transport, les modalités d'itinéraire et une liste des incontournables")
Sortie :
transport = web_search(query="Shanghai to Beijing transportation weekend trip 2024")
print("Transportation options:", transport)
attractions = web_search(query="Beijing 2-day itinerary top attractions 2024")
print("Attraction recommendations:", attractions)
details = web_search(query="Beijing travel must-haves 2024")
print("Essential items and tips:", details)
weekend_plan = {
"Transportation": {
"Recommended Option": "Friday evening G12 train (18:00-22:30) from Shanghai Hongqiao to Beijing South",
"Alternative": "Saturday morning flight (07:00-09:00+transit time)"
},
"Itinerary": {
"Day 1 (Saturday)": [
"08:30 - Tiananmen Square (free entry)",
"10:00 - Forbidden City (booked ticket, 3-4hr tour)",
"14:00 - Temple of Heaven",
"Evening: Houhai Lake dinner + hutongs exploration"
],
"Day 2 (Sunday)": [
"07:00 - Depart for Mutianyu Great Wall (book shuttle/taxi)",
"09:00-12:00 - Great Wall visit (cable car recommended)",
"14:00 - Summer Palace",
"18:00 - Return to city, take G27 train (19:00-23:18) back to Shanghai"
]
},
"Must-Haves": [
"Pre-booked Forbidden City ticket (¥60)",
"Comfortable walking shoes",
"Layered clothing (check weather forecast)",
"Portable WiFi/power bank",
"WeChat Pay/Alipay balance",
"ID/passport for train ticket collection"
]
}
final_answer(weekend_plan)
Réponse finale
Réponse finale : {'Transport': {'Option recommandée': 'Vendredi soir, train G12 (18h00-22h30) de Shanghai Hongqiao à Pékin Sud', 'Alternative': 'Vol samedi matin (07h00-09h00 + temps de transit)'}, 'Itinéraire': {'Jour 1 (samedi)': ['08h30 - Place Tian'anmen (entrée gratuite)', '10h00 - Cité interdite (billet réservé, visite de 3 à 4 heures)', '14h00 - Temple du Ciel', 'Soirée : dîner au lac Houhai + exploration des hutongs'], 'Jour 2 (dimanche)': ['07h00 - Départ pour la Grande Muraille de Mutianyu (réserver une navette/un taxi)', '09h00-12h00 - Visite de la Grande Muraille (téléphérique recommandé)', '14h00 - Palais d'été', '18h00 - Retour en ville, prendre le train G27 (19h00-23h18) pour retourner à Shanghai']}, 'Indispensables' : ['Billet pré-réservé pour la Cité interdite (60 ¥)', 'Chaussures de marche confortables', 'Vêtements superposés (vérifier la météo)', 'Wi-Fi portable/batterie externe', 'Solde WeChat Pay/Alipay', 'Pièce d'identité/passeport pour le retrait des billets de train']}
Comparaison des performances des modèles dans smolagents
L'IA agentique représente une avancée majeure en intelligence artificielle, permettant la résolution autonome de problèmes et l'exécution de tâches. La bibliothèque Smolagents offre un framework léger et puissant, spécialement conçu pour la création d'agents intelligents, privilégiant les actions directes basées sur le code et la compatibilité avec une grande variété de modèles de langage étendus.LLMs). Alors que les modèles open source continuent de s'améliorer rapidement, Smolagents offre aux développeurs une boîte à outils accessible et polyvalente pour explorer et mettre en œuvre le potentiel prometteur de l'IA agentique dans divers domaines.
Questions fréquemment posées
Quelle est la principale différence entre l’IA agentique et l’IA générative ?
L'IA générative se concentre sur la création de nouveaux contenus tels que du texte et des images, tandis que l'IA agentique se concentre sur la prise de décisions et l'exécution de tâches autonomes pour atteindre des objectifs.
L'exécution de code dans smolagents est-elle sécurisée ?
smolagents fournit des options pour l'exécution de code sécurisée, y compris un environnement sandbox utilisant E2B ou Docker, ce qui supprime le risque pour votre système local.
Où puis-je trouver plus d'informations sur les smolagents ?
Vous pouvez trouver une documentation complète, des tutoriels et des exemples sur le référentiel GitHub smolagents et sur l'espace Hugging Face Space dédié à la bibliothèque.
Novita AI est la plateforme cloud tout-en-un qui concrétise vos ambitions en matière d'IA. API intégrées, sans serveur, GPU Instance : les outils économiques dont vous avez besoin. Éliminez l'infrastructure, démarrez gratuitement et concrétisez votre vision de l'IA.