Wichtige Highlights
1. KI-Agent:
Ermöglicht autonome Entscheidungsfindung jenseits starrer, vordefinierter Arbeitsabläufe.
Nutzt iteratives Denken, adaptive Ausführung und kontinuierliches Lernen.
2. Smolagents:
Leichtgewichtige Python-Bibliothek (~1.000 Zeilen), vereinfacht die Erstellung von KI-Agenten.
Gibt direkt ausführbare Python-Code-Snippets aus, die sicher in Sandbox-Umgebungen ausgeführt werden.
Unterstützt verschiedene Modelle, Modalitäten (Text, Bilder, Audio, Video) und die Integration externer Tools.
3. Novita AI-Unterstützung:
Kompatibel mit Smolagents, unterstützt leistungsstarke Modelle wie DeepSeek R1 Turbo mit verbesserter Leistung und Erschwinglichkeit.
Künstliche Intelligenz hat sich von der Mustererkennung zur Erstellung kreativer Inhalte entwickelt. Der nächste bedeutende Schritt ist das Aufkommen von agentischer KI – Systeme, die in der Lage sind, autonom Entscheidungen zu treffen und zu handeln, um komplexe, mehrstufige Probleme zu lösen. Dieser Artikel untersucht das Konzept der KI-Agenten, taucht in die Besonderheiten von Code-Agenten ein, skizziert, wie man einen solchen baut, diskutiert die Leistung verschiedener zugrunde liegender Modelle und beantwortet häufig gestellte Fragen zu dieser transformativen Technologie.
Was ist ein KI-Agent?
Agentische KI begegnet den Herausforderungen, die traditionelle, starre Arbeitsabläufe nur schwer effektiv bewältigen können. Viele reale Szenarien umfassen komplexe, nuancierte Prozesse, die nicht vollständig durch statische, vordefinierte Wenn-Dann-Strukturen abgebildet werden können. Agentische KI bringt Flexibilität und Anpassungsfähigkeit in Arbeitsabläufe und befähigt Systeme, dynamisch die optimale Abfolge von Aktionen basierend auf sich entwickelnden Kontexten zu bestimmen und auszuführen.
Wie funktioniert es?
Agentische KI arbeitet in einer iterativen, dynamischen Schleife des Wahrnehmens, Denkens, Handelns und Lernens. Im Kern nutzen KI-Agenten Große Sprachmodelle (LLMs) als Denkmotoren, um Situationen zu analysieren, Reaktionen zu planen, spezialisierte Modelle zu koordinieren und Aufgaben auszuführen. Der Arbeitsablauf umfasst typischerweise die folgenden Schritte:
- Datenerfassung und Wahrnehmung: Agenten sammeln und verarbeiten Daten aus mehreren Quellen, erlangen kontextuelles Bewusstsein, um ihre Entscheidungsprozesse zu informieren.
- Denken und Planen: Mithilfe von LLMs interpretieren Agenten Daten, denken über mögliche Lösungen nach, erstellen strategische Pläne und bestimmen notwendige Aktionen, um ihre Ziele zu erreichen.
- Handeln und Ausführen: Agenten integrieren sich mit externen Tools und vordefinierten Funktionen und führen Aufgaben basierend auf ihren Denkergebnissen aus. Sie führen iterativ Aktionen durch, beobachten Ergebnisse und passen sich entsprechend an, bis sie das gewünschte Ergebnis erreicht haben.
- Kontinuierliches Lernen: Durch Feedbackschleifen und Techniken wie Retrieval-Augmented Generation (RAG) greifen Agenten auf proprietäre Datenquellen zu, verfeinern ihr Verständnis und verbessern kontinuierlich ihre Leistung, Genauigkeit und Relevanz.
Durch die Kombination dieser Fähigkeiten – autonome Entscheidungsfindung, iteratives Denken, Integration externer Tools und kontinuierliche Verbesserung – überbrückt agentische KI effektiv die LLM-basierte Argumentation mit realer Ausführung und Anpassung.

von Nvidia
Was ist smolagents?
Smolagents ist eine leichtgewichtige Python-Bibliothek, die entwickelt wurde, um das Erstellen leistungsstarker KI-Agenten zu vereinfachen. Mit einem minimalistischen Ansatz passt ihre Kernlogik in etwa 1.000 Zeilen Code und bietet minimale Abstraktionen und mehr direkte Kontrolle für Entwickler. Smolagents wird als Nachfolger von transformers.agents positioniert, das irgendwann eingestellt wird. Weitere Details findest du auf github!

Wichtige Funktionen und Schlüsselmechanismus
✨ Einfachheit
- Smolagents implementiert leistungsstarke KI-Agentenlogik in etwa 1.000 Zeilen Code und hält Abstraktionen minimal für größere Entwicklerflexibilität (siehe
agents.py).
🧑💻 Erstklassige Code-Agenten-Unterstützung
- Der CodeAgent von Smolagents gibt Aktionen des Agenten direkt als Python-Code-Snippets aus, anstatt als JSON oder Text, was Effizienz und Leistung verbessert. Er führt Code sicher in Sandbox-Umgebungen (E2B, Docker) aus und behält die Unterstützung für traditionelle JSON/Text-basierte Agenten bei.
🤗 Hub-Integrationen
- Smolagents ermöglicht einfaches Teilen und Laden wiederverwendbarer, Python-basierter Tools über den Hugging Face Hub und optimiert so die Zusammenarbeit und Wiederverwendung von Tools.
🌐 Modellunabhängig
- Smolagents unterstützt praktisch jedes Große Sprachmodell (LLM) – lokale Transformers- oder Ollama-Modelle, auf Hugging Face gehostete Modelle sowie externe Anbieter wie OpenAI oder Anthropic über LiteLLM.
👁️ Modalitätsunabhängig
- Mit Smolagents erstellte Agenten können nahtlos verschiedene Eingabemodalitäten verarbeiten, darunter Text, Bilder, Videos und Audio.
🛠️ Toolunabhängig
- Smolagents integriert flexibel Tools aus verschiedenen Ökosystemen, wie LangChain, Anthropics MCP oder Hugging Face Hub Spaces.

Wie erstelle ich einen Agenten mit Smolagents und der Novita AI API?
Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle über unsere einfache API bereitzustellen und gleichzeitig die kostengünstige und zuverlässige GPU-Cloud zum Aufbau und zur Skalierung bereitstellt.
Smolagents unterstützt verschiedene Große Sprachmodelle (LLMs), darunter Novita AI! Als Nächstes verwenden wir DeepSeek R1 Turbo als Beispiel, um die Leistungsfähigkeit von Smolagents und Novita AI zu demonstrieren!
Bedeutsamerweise bringt Novita AI eine Turbo-Version mit dem 3-fachen Durchsatz und einem zeitlich begrenzten Rabatt von 60 % heraus!
Jetzt DeepSeek R1 Turbo ausprobieren!
Ein Beispiel
Eingabe:
import os
from smolagents import OpenAIServerModel, CodeAgent, DuckDuckGoSearchTool
model = OpenAIServerModel(
model_id="deepseek/deepseek-r1-turbo",
api_base="https://api.novita.ai/v3/openai",
api_key="Your API Key" # Switch to the API key for the server you're targeting.
)
agent = CodeAgent(tools=[DuckDuckGoSearchTool()], model=model)
agent.run("Please plan a weekend trip from Shanghai to Beijing, including transportation options, itinerary arrangements and a list of must-haves")
Ausgabe:
transport = web_search(query="Shanghai to Beijing transportation weekend trip 2024")
print("Transportation options:", transport)
attractions = web_search(query="Beijing 2-day itinerary top attractions 2024")
print("Attraction recommendations:", attractions)
details = web_search(query="Beijing travel must-haves 2024")
print("Essential items and tips:", details)
weekend_plan = {
"Transportation": {
"Recommended Option": "Friday evening G12 train (18:00-22:30) from Shanghai Hongqiao to Beijing South",
"Alternative": "Saturday morning flight (07:00-09:00+transit time)"
},
"Itinerary": {
"Day 1 (Saturday)": [
"08:30 - Tiananmen Square (free entry)",
"10:00 - Forbidden City (booked ticket, 3-4hr tour)",
"14:00 - Temple of Heaven",
"Evening: Houhai Lake dinner + hutongs exploration"
],
"Day 2 (Sunday)": [
"07:00 - Depart for Mutianyu Great Wall (book shuttle/taxi)",
"09:00-12:00 - Great Wall visit (cable car recommended)",
"14:00 - Summer Palace",
"18:00 - Return to city, take G27 train (19:00-23:18) back to Shanghai"
]
},
"Must-Haves": [
"Pre-booked Forbidden City ticket (¥60)",
"Comfortable walking shoes",
"Layered clothing (check weather forecast)",
"Portable WiFi/power bank",
"WeChat Pay/Alipay balance",
"ID/passport for train ticket collection"
]
}
final_answer(weekend_plan)
Finale Antwort
Final answer: {'Transportation': {'Recommended Option': 'Friday evening G12 train (18:00-22:30) from Shanghai Hongqiao to Beijing South', 'Alternative': 'Saturday morning flight (07:00-09:00+transit time)'}, 'Itinerary': {'Day 1 (Saturday)': ['08:30 - Tiananmen Square (free entry)', '10:00 - Forbidden City (booked ticket, 3-4hr tour)', '14:00 - Temple of Heaven', 'Evening: Houhai Lake dinner + hutongs exploration'], 'Day 2 (Sunday)': ['07:00 - Depart for Mutianyu Great Wall (book shuttle/taxi)', '09:00-12:00 - Great Wall visit (cable car recommended)', '14:00 - Summer Palace', '18:00 - Return to city, take G27 train (19:00-23:18) back to Shanghai']},
'Must-Haves': ['Pre-booked Forbidden City ticket (¥60)', 'Comfortable walking shoes', 'Layered clothing (check weather forecast)', 'Portable WiFi/power bank', 'WeChat Pay/Alipay balance', 'ID/passport for train ticket collection']}
Modellleistung in Smolagents vergleichen

Weitere Details findest du auf Hugging Face
Agentische KI stellt einen großen Fortschritt in der künstlichen Intelligenz dar und ermöglicht autonome Problemlösung und Aufgabenausführung. Die Smolagents-Bibliothek bietet ein leichtgewichtiges und dennoch leistungsstarkes Framework, das speziell für den Bau intelligenter Agenten entwickelt wurde und direkte codebasierte Aktionen sowie Kompatibilität mit einer Vielzahl von Großen Sprachmodellen (LLMs) betont. Da Open-Source-Modelle sich weiterhin schnell verbessern, bietet Smolagents Entwicklern ein zugängliches und vielseitiges Toolkit, um das spannende Potenzial agentischer KI in verschiedenen Bereichen zu erkunden und umzusetzen.
Häufig gestellte Fragen
Was ist der Hauptunterschied zwischen agentischer KI und generativer KI?
Generative KI konzentriert sich auf die Erstellung neuer Inhalte wie Text und Bilder, während agentische KI sich auf das Treffen von Entscheidungen und die autonome Ausführung von Aufgaben konzentriert, um Ziele zu erreichen.
Ist die Codeausführung in Smolagents sicher?
Smolagents bietet Optionen für sichere Codeausführung, darunter eine Sandbox-Umgebung mit E2B oder Docker, die das Risiko für dein lokales System beseitigt.
Wo finde ich weitere Informationen zu Smolagents?
Die vollständige Dokumentation, Tutorials und Beispiele findest du im Smolagents-GitHub-Repository und dem dem H!ugging Face Space der Bibliothek gewidmeten Bereich.
Novita AI ist die All-in-One-Cloud-Plattform, die deine KI-Ambitionen beflügelt. Integrierte APIs, serverlose Umgebungen, GPU-Instanzen – die kostengünstigen Tools, die du brauchst. Infrastruktur weglassen, kostenlos starten und deine KI-Vision Wirklichkeit werden lassen.

