Sind klassische KI-Modelle bald Geschichte? Mit der Entwicklung von KI-Agenten könnte die Art und Weise, wie wir arbeiten, bald völlig neu definiert werden.
Künstliche Intelligenz hat seit dem Aufkommen von Large-Language-Modellen (LLMs) wie ChatGPT im Jahr 2022 große Bekanntheit erlangt und einen regelrechten Hype ausgelöst. Während kontinuierlich neue Modelle von OpenAI und anderen Anbietern erscheinen, zeichnet sich bereits die nächste Technologie am Horizont ab: KI-Agenten. Diese Systeme haben das Potenzial, die Art und Weise, wie wir arbeiten, grundlegend zu verändern.
Die Grenzen monolithischer KI-Modelle
Der „Klassiker“ unter den bekannten KIs kann als „monolithisches Modell“ bezeichnet werden. Dabei handelt es sich um Modelle, die als eine große Einheit trainiert wurden und eigenständig arbeiten. Ein prominentes Beispiel ist GPT-3, das auf riesigen Textmengen trainiert wurde (ca. 600 GB an Textdaten) und bei seinem Release im November 2022 beeindruckende Leistungen zeigte.
Der Nachteil solcher Modelle besteht darin, dass sie auf die Daten limitiert sind, die während des Trainings verarbeitet wurden. Eine Anpassung oder Erweiterung des Wissens ist nur durch erneutes Training mit hohem Aufwand möglich.
Doch die Entwicklung geht weiter – komplexere Systeme wie ‚compound systems‘ bieten neue Möglichkeiten.
Aufbau eines monolithischen Modells, Quelle: eigene Darstellung
Compound Systems: Der nächste Schritt in der KI-Entwicklung
Eine Erweiterung der klassischen LLMs stellen die sogenannten „Compound Systems“ dar. Ein bekanntes Beispiel ist RAG (Retrieval Augmented Generation). Diese Systeme nutzen zusätzliche Informationen aus einer Datenbank, die Daten in numerischer Form (Vektorrepräsentation) speichert. Dies ermöglicht eine effizientere Verarbeitung durch LLMs.
Der große Vorteil: Um das Modell zu aktualisieren, muss nur die Datenbank angepasst werden. Zudem lassen sich Quellen für Textpassagen einfügen, die dann in die Antwort integriert werden können. Dadurch sinkt die Wahrscheinlichkeit für Halluzinationen (erfundene Informationen), da das Modell erkennt, wenn gesuchte Informationen fehlen.
Ein Nachteil der Compound Systems ist ihre eingeschränkte Eigenständigkeit. Wenn etwa der Prompt „Buche mir ein Bahnticket für den 24.12.“ eingeht, kann das System zwar den Kalender durchsuchen, jedoch nicht die eigentliche Buchung vornehmen. Der Grund liegt darin, dass die Logik fest einprogrammiert ist und nicht flexibel angepasst werden kann.
Aufbau eines Compound Systems, Quelle: eigene Darstellung
KI-Agenten: Flexible Problemlöser der Zukunft
Dieses Problem der Unselbstständigkeit versuchen Agentensysteme zu lösen. Hier übernimmt ein zentrales LLM (Core) die Entscheidungsfindung. Der Benutzer stellt wie gewohnt eine Anfrage, doch anstatt sofort zu antworten, entwickelt der Core einen Plan, um die Aufgabe Schritt für Schritt zu lösen.
Die drei zentralen Fähigkeiten eines KI-Agenten sind:
Logisches „Denken“: Der Benutzer schickt einen Prompt an den Core des Agenten, der auf dieser Basis einen Plan über die Ausführung der Aufgabe erstellt und jeden Schritt auf dem Weg zur Lösung des Problems ausarbeitet.
Handeln: Dieser Core (selbst ein LLM) entscheidet darüber hinaus, welche Tools eingesetzt werden sollen. Dies kann jede Art von Programm sein. Beispielhafte Tools sind das Suchen von Informationen, Erstellen und Ausführen von Code, Aufrufen von APIs oder Verwenden eines weiteren, möglicherweise spezialisierten LLMs. Der Core entscheidet auch darüber, wie genau die Tools eingebunden werden sollen und führt dies durch.
Speicherzugriff: Der Core hat Zugriff auf eine Datenbank, auf der die Präferenzen des Users inklusive einer Beschreibung, wie sich der Agent generell und in bestimmten Fällen verhalten soll, enthalten sind. Diese Anweisungen zieht der Agent bei Planung der Aktionen heran und handelt entsprechend. Um den eigenen „Denkprozess“ zu strukturieren schreibt der Core zudem Logs auf die Datenbank und liest diese bei Bedarf.
Die Besonderheit liegt darin, dass der Core die erhaltenen Ergebnisse ständig überprüft und bei Bedarf die gewählten Tools erneut einsetzt oder anpasst. So wird sichergestellt, dass die Anforderungen erfüllt sind, bevor die Antwort ausgegeben wird.
Aufbau eines KI-Agenten, Quelle: eigene Darstellung
Die Zukunft der KI-Arbeit
In modernen Agentensystemen arbeiten mehrere dieser KI-Agenten zusammen, wobei jeder eine klar definierte Aufgabe übernimmt. Das Zusammenspiel ermöglicht die Automatisierung komplexer Geschäftsprozesse, solange die Aufgabenstellung klar definiert ist.
Agentensysteme eignen sich besonders für variable und komplexe Tasks, bei denen flexibles Handeln gefordert ist – wie zum Beispiel das selbstständige Bearbeiten von Jira-Issues. Für einfachere Aufgaben mit festem Ablauf, wie Wetteranfragen, bleiben die Compound Systems besser geeignet.
Fazit
KI-Agenten haben das Potenzial, die Arbeitswelt nachhaltig zu verändern. Doch die Technologie steckt noch in den Kinderschuhen. Ob sie den klassischen LLMs tatsächlich den Rang ablaufen, bleibt abzuwarten.
Der Beitrag KI-Agenten: Die Zukunft der künstlichen Intelligenz? erschien zuerst auf Business -Software- und IT-Blog – Wir gestalten digitale Wertschöpfung.