Entdecke die Geheimnisse der Entwicklung deines eigenen Sprachmodells mit LangChain. Vereinfache den Prozess, integriere mühelos und entfessle die Kraft der KI-Entwicklung.
Einführung
Große Sprachmodelle (LLMs) wie OpenAI’s GPT-3, Google’s BERT und Meta’s LLaMA revolutionieren verschiedene Branchen, indem sie die Erzeugung unterschiedlicher Textarten ermöglichen – von Marketingmaterial und Data-Science-Code bis hin zu Gedichten. Während ChatGPT durch seine benutzerfreundliche Chat-Oberfläche große Aufmerksamkeit erlangt hat, gibt es zahlreiche ungenutzte Möglichkeiten, LLMs in verschiedene Softwareanwendungen zu integrieren. Wenn du von den transformativen Möglichkeiten generativer KI und LLMs fasziniert bist, ist dieses Tutorial genau das Richtige für dich. Hier stellen wir LangChain vor – ein Open-Source-Python-Framework, das für die Entwicklung von Anwendungen mit LLMs wie GPT konzipiert wurde. Erkunde die Welt der KI-Anwendungsentwicklung mit LangChain in unserer Session „Building Multimodal AI Applications with LangChain & the OpenAI API AI Code Along“. Du wirst lernen, YouTube-Videoinhalte mit der Whisper-Spracherkennungs-KI zu transkribieren und anschließend GPT zu verwenden, um Fragen zum Inhalt zu stellen.

Was ist LangChain?
LangChain ist ein Open-Source-Framework, das sorgfältig entwickelt wurde, um die Entwicklung von Anwendungen, die auf großen Sprachmodellen (LLMs) basieren, zu optimieren. Es bietet eine umfassende Palette von Werkzeugen, Komponenten und Schnittstellen, die darauf abzielen, die Erstellung von LLM-zentrierten Anwendungen zu vereinfachen. Mit LangChain wird die Verwaltung von Interaktionen mit Sprachmodellen, das nahtlose Verknüpfen verschiedener Komponenten und die Integration von Ressourcen wie APIs und Datenbanken zu einer mühelosen Aufgabe. Weitere Einblicke in die Rolle von LangChain in der Datenverarbeitung und Datenanwendungen findest du in unserem speziellen Artikel. Die LangChain-Plattform bietet eine Reihe von APIs, die Entwickler nahtlos in ihre Anwendungen einbetten können, um ihnen Sprachverarbeitungsfunktionen zu verleihen, ohne bei Null anfangen zu müssen. Folglich beschleunigt LangChain den Prozess der Erstellung LLM-basierter Anwendungen erheblich und macht ihn für Entwickler mit unterschiedlichem Erfahrungsniveau zugänglich. Chatbots, virtuelle Assistenten, Sprachübersetzungsprogramme und Sentimentanalyse-Tools sind Beispiele für die vielfältigen Anwendungen, die von LLMs angetrieben werden. Mit LangChain können Entwickler maßgeschneiderte Sprachmodellanwendungen entwickeln, die auf spezifische Anforderungen zugeschnitten sind. Während die natürliche Sprachverarbeitung mit zunehmender Verbreitung weiter voranschreitet, sind die potenziellen Anwendungen dieser Technologie praktisch grenzenlos. Hier sind einige herausragende Merkmale, die LangChain auszeichnen:
- Anpassbare Prompts, die auf spezifische Bedürfnisse zugeschnitten sind
- Erstellung von Chain-Link-Komponenten für fortgeschrittene Anwendungsszenarien
- Nahtlose Integration von Modellen zur Datenerweiterung und Nutzung modernster Sprachmodellfunktionen wie GPT und HuggingFace Hub
- Vielseitige Komponenten, die je nach Bedarf kombiniert werden können
- Manipulation des Kontexts, um die Richtung für höhere Präzision und Benutzerzufriedenheit festzulegen
Schlüsselkomponenten von LangChain
LangChain zeichnet sich durch seinen Fokus auf Flexibilität und Modularität aus, indem es die Pipeline der natürlichen Sprachverarbeitung in diskrete Komponenten unterteilt. Dieser Ansatz ermöglicht es Entwicklern, Workflows an ihre Anforderungen anzupassen, wodurch LangChain für eine Vielzahl von KI-Anwendungen in verschiedenen Branchen und Szenarien geeignet ist.
Komponenten und Chains
Innerhalb von LangChain sind Komponenten spezialisierte Module, die bestimmte Funktionen innerhalb der Sprachverarbeitungspipeline ausführen. Diese Komponenten können zu sogenannten Chains verbunden werden, was die Erstellung maßgeschneiderter Arbeitsabläufe ermöglicht. Beispielsweise könnte eine Kette für einen Kundendienst-Chatbot Module für Sentimentanalyse, Absichtserkennung und Antwortgenerierung enthalten.
Prompt-Vorlagen
LangChain bietet wiederverwendbare Prompt-Vorlagen, die durch Einfügen bestimmter Werte dynamisch angepasst werden können. Beispielsweise kann eine Vorlage, die nach dem Namen eines Benutzers fragt, durch Einfügen des tatsächlichen Namens personalisiert werden. Diese Funktion erleichtert die Erstellung von Prompts basierend auf dynamischen Ressourcen.
Vektorspeicher
Vektorspeicher ermöglichen die Speicherung und den Abruf von Informationen über Embeddings, die numerische Darstellungen der Bedeutung von Dokumenten analysieren. Sie dienen als Speicher für diese Embeddings und ermöglichen eine effiziente Suche basierend auf semantischer Ähnlichkeit.

Indizes und Retriever
Indizes fungieren als Datenbanken, die Details und Metadaten zu den Trainingsdaten des Modells speichern, während Retriever diesen Index schnell nach bestimmten Informationen durchsuchen. Dies verbessert die Antworten des Modells, indem Kontext und verwandte Informationen bereitgestellt werden.
Ausgabe-Parser
Ausgabe-Parser verfeinern die vom Modell generierten Antworten, indem sie unerwünschte Inhalte verwalten, das Ausgabeformat anpassen oder zusätzliche Daten zur Antwort hinzufügen. Daher helfen Ausgabe-Parser dabei, strukturierte Ergebnisse wie JSON-Objekte aus den Antworten des Sprachmodells zu extrahieren.
Beispiel-Selektoren
Beispiel-Selektoren in LangChain identifizieren relevante Instanzen aus den Trainingsdaten des Modells und verbessern so die Genauigkeit und Relevanz der generierten Antworten. Diese Selektoren können angepasst werden, um bestimmte Arten von Beispielen zu priorisieren oder irrelevante auszuschließen, was maßgeschneiderte KI-Antworten basierend auf Benutzereingaben gewährleistet.
Agenten
Agenten sind einzigartige LangChain-Instanzen, die jeweils mit spezifischen Prompts, Gedächtnis und Chains ausgestattet sind, die auf bestimmte Anwendungsfälle zugeschnitten sind. Diese Agenten können auf verschiedenen Plattformen eingesetzt werden, einschließlich Web, mobilen Geräten und Chatbots, und richten sich an ein vielfältiges Publikum.
So richtest du LangChain mit Python ein
Die Installation von LangChain in Python ist relativ einfach. Du kannst es entweder mit pip oder conda installieren.
Installation mit pip

Installation mit conda
Das Einrichten des grundlegenden Frameworks von LangChain legt das Fundament für seine Funktionalität. LangChain entfaltet sein wahres Potenzial jedoch erst, wenn es nahtlos in eine breite Palette von Modellanbietern, Datenspeichern und ähnlichen Ressourcen integriert wird.
Umgebungseinrichtung
Die Integration von LangChain beinhaltet in der Regel die Einbindung verschiedener Modellanbieter, Datenspeicher, APIs und ähnlicher Komponenten. Wie bei jedem Integrationsprozess ist es wichtig, LangChain mit den erforderlichen und relevanten API-Schlüsseln für den Betrieb zu versorgen. Dies kann auf zwei Arten erfolgen:
- Einrichtung des Schlüssels als Umgebungsvariable
- Direkte Einrichtung des Schlüssels in der entsprechenden Klasse
Wie man eine Sprachmodellanwendung in LangChain erstellt
LangChain bietet eine LLM-Klasse, die für die Schnittstelle zu verschiedenen Sprachmodellanbietern wie OpenAI, Cohere und Hugging Face entwickelt wurde. Die primäre Funktion eines LLM ist die Texterzeugung. Mit LangChain ist die Erstellung einer Anwendung, die eine Zeichenfolge als Prompt nimmt und die entsprechende Ausgabe liefert, bemerkenswert einfach.
Ausgabe: >>> „Was bekommst du, wenn du mit Daten herumspielst? Einen Datenwissenschaftler!“ Im obigen Beispiel verwenden wir das Modell text-ada-001 von OpenAI. Wenn du dieses gegen ein beliebiges Open-Source-Modell von HuggingFace austauschen möchtest, ist das eine einfache Änderung:
Du erhältst die Hugging Face Hub-Token-ID von deinem HF-Konto. Wenn du mehrere Prompts hast, kannst du eine Liste von Prompts gleichzeitig mit der Methode generate senden:
Ausgabe:

1
Die grundlegendste Anwendung, die du mit LangChain entwickeln kannst, besteht darin, einen Prompt an ein Sprachmodell deiner Wahl zu senden und eine Antwort zu erhalten. Dieser einfache Aufbau ermöglicht die Anpassung verschiedener Parameter, wie z. B. der temperature. Der Temperaturparameter reguliert die Zufälligkeit der Ausgabe und beträgt standardmäßig 0,7.
Integration von LLMs und Prompts in mehrstufigen Workflows
Verkettung im LangChain-Kontext beinhaltet die Integration von LLMs mit anderen Elementen, um eine Anwendung zu erstellen. Beispiele sind:
- Sequenzielles Verketten mehrerer LLMs, wobei die Ausgabe des ersten LLM als Eingabe für das zweite LLM dient.
- Integration von LLMs mit Prompt-Vorlagen.
- Kombination von LLMs mit externen Datenquellen, z. B. für die Beantwortung von Fragen.
- Einbeziehung von LLMs mit Langzeitspeicher, z. B. Chat-Verlauf.
Fazit und Inspiration
Vor nicht allzu langer Zeit haben uns die beeindruckenden Fähigkeiten von ChatGPT alle in Staunen versetzt. Doch die Landschaft hat sich rasant weiterentwickelt und uns neue Entwicklertools wie LangChain beschert, die es uns ermöglichen, innerhalb weniger Stunden ähnlich bemerkenswerte Prototypen auf unseren persönlichen Laptops zu erstellen. LangChain, ein Open-Source-Python-Framework, befähigt Einzelpersonen, Anwendungen zu entwickeln, die von LLMs (Large Language Models) angetrieben werden. Dieses Framework bietet eine vielseitige Schnittstelle zu einer Vielzahl von Grundlagenmodellen, vereinfacht die Prompt-Verwaltung und fungiert als zentraler Knotenpunkt für verschiedene Komponenten wie Prompt-Vorlagen, zusätzliche LLMs, externe Daten und andere Werkzeuge über Agenten (Stand des letzten Updates). Um über die neuesten Fortschritte im Bereich Generative KI und LLM auf dem Laufenden zu bleiben, erwäge die Teilnahme an unserem Webinar „Building AI Applications with LangChain and GPT“. In dieser Sitzung lernst du die Grundlagen der Nutzung von LangChain für die KI-Anwendungsentwicklung, erfährst, wie man eine KI-Anwendung strukturiert, und entdeckst Techniken zur Einbettung von Textdaten für optimale Leistung. Außerdem kannst du unseren Spickzettel zur Landschaft der generativen KI-Tools erkunden, der verschiedene Tools, ihre Anwendungen und ihre Auswirkungen in verschiedenen Bereichen kategorisiert. Oder du kannst direkt unser Large Language Model von novita.ai ausprobieren. Ausgestattet mit verschiedenen Modellen bietet unser LLM dir unzensierte, uneingeschränkte Gespräche über leistungsstarke Inference-APIs. Mit günstigsten Preisen und skalierbaren Modellen bietet die Novita AI LLM Inference API deinem LLM eine unglaubliche Stabilität und eine relativ niedrige Latenz von unter 2 Sekunden.

novita.ai, die Komplettlösung für grenzenlose Kreativität, die dir Zugang zu über 100 APIs bietet. Von Bildgenerierung und Sprachverarbeitung bis hin zur Audioverbesserung und Videobearbeitung, günstig nach Verbrauch – befreit von der GPU-Wartung, während du deine eigenen Produkte entwickelst. Probiere es kostenlos aus.
Empfohlene Lektüre
Novita AI LLM Inference Engine: der größte Durchsatz und die günstigste Inference verfügbar
