KI-Agenten im E-Commerce
Christoph Vogt

Christoph Vogt

18 Minuten Lesezeit

KI-Agenten im E-Commerce

Laut dem State of the Agentic AI Market Report 2025 erwarten mehr als 70 % der befragten KI-Experten, dass Agenten-Technologie bis Ende 2025 ein fester Bestandteil des Geschäftsalltags sein wird.

Für Amazon Seller, Vendoren und Agenturen eröffnet dies erhebliche Potenziale – von der Content-Erstellung über die PPC-Optimierung bis zur Produktrecherche. In diesem Artikel erfahren Sie, wie KI-Agenten arbeiten und wie Sie sie im E-Commerce praktisch einsetzen können. Ergänzende Links zu kostenlosen Guides und Kursen bieten Ihnen die Möglichkeit, das Thema weiter zu vertiefen.

Was ist ein KI-Agent?

Das Feld der agentischen KI befindet sich noch in einer frühen Entwicklungsphase. Viele Begriffe werden unscharf verwendet. Nicht jedes System, das mithilfe großer Sprachmodelle (LLMs) Inhalte erzeugt, ist automatisch ein KI‑Agent.

Damit eine Lösung als Agent gilt, sollte sie mindestens zwei der drei folgenden Kriterien erfüllen:

  • Autonomie & Planung: Ein Agent ist kein reiner Befehlsempfänger. Er analysiert ein Ziel, zerlegt es in Teilaufgaben und erstellt einen Handlungsplan. Er entscheidet selbstständig über die Reihenfolge der Schritte und wählt die passenden Werkzeuge für jede Aufgabe aus. Der Agent bewertet die Ergebnisse seiner Aktionen, erkennt Fehler oder ineffiziente Pfade und passt seine Strategie dynamisch an. Dies ermöglicht ihm, auf unvorhergesehene Probleme zu reagieren und seine Leistung über die Zeit zu verbessern.

  • Werkzeug-Integration: Durch die Integration von externen Werkzeugen (APIs, Datenbanken, Webservices) kann ein Agent nicht nur Informationen abrufen, sondern auch konkrete Aktionen ausführen – wie eine E-Mail senden, Daten in ein CRM-System eintragen oder eine Buchung vornehmen.

  • Zugriff auf spezielles Wissen: Ein Agent besitzt häufig ein “Gedächtnis” und kann hier auf Informationen zurückgreifen, die i.d.R. nicht Teil der Trainingsdaten oder des Systemprompts sind. Das können z.B. Firmeninterna oder viele nicht öffentliche “Handbücher” sein. Diese kann der Agent durchsuchen, um seine Handlungen auf Basis dieses Wissens anzupassen.

Durch diese Kriterien lassen sich Agenten auch von reinen Chatbots unterscheiden, die ihre Antworten ausschließlich auf Basis des trainierten Wissens geben.

Eine klare Trennung zwischen Agenten und Tools wie ChatGPT wird aber zunehmend schwieriger, da auch ChatGPT über diverse Werkzeuge wie Websuche, Ausführung von Code und zum Teil auch ein Gedächtnis verfügt.

Wie funktioniert ein KI-Agent?

KI-Agenten kombinieren mehrere Komponenten zu einem handlungsfähigen System. Im Zentrum steht in der Regel ein großes Sprachmodell (LLM) – etwa GPT-5, Claude Sonnet oder ein Open-Source-Modell. Dieses LLM übernimmt die Rolle des “Denkers”: Es analysiert die Ziele, plant die notwendigen Schritte und trifft Entscheidungen.

Die Steuerung erfolgt über einen Agenten-Loop: Einen wiederkehrenden Zyklus aus Denken, Handeln und Auswerten. In jeder Wiederholung dieses Zyklus entscheidet der Agent, welches Werkzeug oder welche Information als Nächstes benötigt wird, um dem Ziel näherzukommen.

Die folgende Grafik veranschaulicht die vier zentralen Elemente, die das System antreiben:

Typische Komponenten eines KI-Agenten

Typische Komponenten eines KI-Agenten (Quelle: AMALYTIX)
  1. Der Nutzer: Er gibt das übergeordnete Ziel in Form eines Prompts vor und erhält am Ende das aufbereitete Ergebnis.

  2. Das Sprachmodell: Das zentrale Gehirn des Agenten. Es empfängt den Prompt, zerlegt das Ziel in Teilaufgaben und erstellt einen Handlungsplan. Es ist die steuernde Instanz, die entscheidet, wann welches Werkzeug oder welche Information benötigt wird.

  3. Das Gedächtnis/Wissen: Hier hat der Agent Zugriff auf wichtige Informationen, die außerhalb der Trainingsdaten des Sprachmodells liegen, wie firmenspezifisches Wissen.

  4. Die Werkzeuge / Tools: Dies sind die “Arme und Augen” des Agenten. Jedes Werkzeug hat eine spezifische Fähigkeit, z. B. im Internet suchen, auf eine Datenbank zugreifen, Code ausführen oder eine Aktion über eine API (Programmierschnittstelle) auslösen. Das LLM kann diese Tools gezielt aufrufen.

Mehrere KI-Agenten lassen sich auch zu einem “Team” zusammenstellen, die miteinander interagieren. Die bisherige Erfahrung (Stand Oktober 2025) zeigt jedoch: Je komplexer diese Teams gebaut werden, desto unzuverlässiger / unberechenbarer ist das Ergebnis. Stand heute sollte die Komplexität also noch reduziert werden.

Praktisches Beispiel: Ein KI-Agent im Einsatz

Stellen wir uns vor, ein Kunde wendet sich an einen E-Commerce-Chatbot ihres Online-Shops mit folgender Anfrage: “Ich möchte meine letzte Bestellung stornieren”

Um diese Aufgabe zu lösen, wird der Agent auf eine Reihe spezialisierter Werkzeuge (Tools) zugreifen, die in der oberen Grafik als “Tool 1, 2, …” dargestellt sind:

  • Tool 1: Bestellungen-API: Kann die Bestellung eines Kunden abrufen und Bestellungen stornieren.
  • Tool 2: E-Mail-API: Kann automatische Bestätigungs-E-Mails an Kunden versenden.

Der Agenten-Loop startet nun:

  • Schritt 1 (Denken & Planen): Das LLM analysiert die Anfrage und greift auf sein internes Wissen zurück. Es erkennt, dass Bestellungen innerhalb von 24 Stunden kostenfrei storniert werden können. Der Plan wird wie folgt erstellt:

    1. Letzte Bestellung suchen (Tool 1).
    2. Bedingungen / internes Wissen prüfen, ob Stornierung kostenfrei möglich ist (innerhalb 24h).
    3. Falls möglich, Bestellung stornieren (Tool 1).
    4. Bestätigungs-E-Mail an Kunden senden (Tool 2).
    5. Kunde über erfolgreiche Stornierung informieren.
  • Schritt 2 (Handeln & Prüfen): Der Agent greift auf Tool 1 (Bestellungen-API) zu, um die Details der letzten Bestellung abzurufen. Das Tool meldet zurück: “Bestellung vom 09.11. um 14

    Uhr, Status: ‘In Bearbeitung’, noch nicht versandt.” Diese Information wird im aktuellen Gesprächskontext gespeichert.

  • Schritt 3 (Wissen anwenden & Entscheiden): Das LLM wendet sein internes Wissen an: “Die Bestellung ist weniger als 24 Stunden alt und noch nicht versandt. Eine kostenfreie Stornierung ist möglich.” Es entscheidet, die Stornierung durchzuführen.

  • Schritt 4 (Handeln & Auswerten): Das LLM ruft Tool 1 (Bestellungen-API) auf und storniert die Bestellung. Das Tool bestätigt: “Bestellung #12345 erfolgreich storniert. Rückerstattung wird innerhalb von 3-5 Werktagen verarbeitet.”

  • Schritt 5 (Handeln & Auswerten): Als Nächstes wird Tool 2 (E-Mail-API) aufgerufen, um eine automatische Bestätigungs-E-Mail an den Kunden zu versenden. Das Tool bestätigt: “Stornierungs-Bestätigung an kunde@email.com versendet.”

  • Schritt 6 (Endergebnis): Der Agent meldet dem Kunden: “Ihre Bestellung #12345 wurde erfolgreich storniert. Sie erhalten eine Bestätigungs-E-Mail und die Rückerstattung wird innerhalb von 3-5 Werktagen auf Ihr ursprüngliches Zahlungsmittel zurückgebucht.”

Wie interagieren Agenten mit der “Außenwelt”?

Die wahre Stärke von KI-Agenten liegt nicht nur in ihrer Fähigkeit zu denken und zu planen, sondern vor allem darin, dass sie aktiv mit der digitalen Welt interagieren können. Während ein einfacher Chatbot nur auf Basis seiner Trainingsdaten antwortet, können Agenten auf aktuelle Informationen zugreifen, Aktionen ausführen und Ergebnisse in Echtzeit verarbeiten. Diese Interaktion mit der “Außenwelt” erfolgt über verschiedene Kanäle, die jeweils ihre eigenen Vor- und Nachteile mitbringen.

Browser

Gibt es keine Schnittstellen (siehe nächster Absatz) nutzen KI-Agenten Browser-Automatisierung, um mit Webseiten zu interagieren. Diese Methode ermöglicht es Agenten, sich wie menschliche Nutzer zu verhalten und Webseiten zu durchsuchen, Formulare auszufüllen oder Daten zu extrahieren.

Moderne Browser-Automatisierungstools wie Playwright oder Selenium ermöglichen es Agenten, echte Browser-Instanzen zu steuern. Der Agent kann dabei JavaScript ausführen, auf Elemente klicken, Texte eingeben und Screenshots erstellen – genau wie ein menschlicher Nutzer.

Ein Amazon-Seller-Agent könnte beispielsweise mithilfe von Browser-Automatisierung Konkurrenzanalysen durchführen, indem er automatisch durch Produktseiten navigiert, Bewertungen sammelt und Preisvergleiche anstellt. Der Agent kann dabei komplexe Suchanfragen ausführen, Filter anwenden und Daten strukturiert erfassen, ohne dass für jede Zielseite eine spezielle API-Integration entwickelt werden muss. Diese Flexibilität macht Browser-basierte Agenten zu einem mächtigen Werkzeug für die Automatisierung von Web-basierten Geschäftsprozessen.

Schnittstellen / APIs

Häufig bedienen sich Agenten sog. APIs / Schnittstellen, die als Brücken zwischen dem Agenten und externen Systemen fungieren. Diese Schnittstellen ermöglichen es dem Agenten, Daten abzurufen, Aktionen auszulösen und mit verschiedenen Plattformen zu kommunizieren.

Im E-Commerce-Kontext greifen Agenten beispielsweise auf Produktdatenbanken zu, um aktuelle Verfügbarkeiten und Preise abzufragen, oder sie nutzen Zahlungs-APIs, um Transaktionen sicher abzuwickeln. Ein Amazon-Seller-Agent könnte über die Amazon Seller Central API auf Verkaufsdaten zugreifen, Bestandsstände abfragen oder neue Produktlistings erstellen.

Die Herausforderung liegt dabei in der Vielfalt der verfügbaren Schnittstellen. Jede Plattform, jedes Tool und jeder Service verfügt über eigene API-Standards, Authentifizierungsmethoden und Datenformate. Ein Agent, der mit verschiedenen Systemen arbeiten soll, muss daher für jede Schnittstelle individuelle Anpassungen vornehmen. Diese Fragmentierung erschwert nicht nur die Entwicklung, sondern auch die Wartung und Skalierung von Agenten-Lösungen.

Daher haben sich die Entwickler von Anthropic etwas ausgedacht, um diese Komplexität zu reduzieren. Das Model Context Protocol (MCP).

Model Context Protocol

Das Model Context Protocol (MCP) von Anthropic stellt eine Lösung für die Komplexität verschiedener API-Standards dar. Es definiert einen einheitlichen Standard, der es ermöglicht, dass KI-Modelle nahtlos mit externen Tools und Datenquellen kommunizieren können, ohne dass für jede Kombination eine individuelle Schnittstelle entwickelt werden muss.

Die Kernidee des MCP ist die Schaffung einer gemeinsamen “Sprache” zwischen KI-Systemen und externen Tools. Man kann es sich als eine Art “USB-C für KI” vorstellen: ein einheitlicher Anschluss, der einfach funktioniert, egal welches Modell oder welches Tool angebunden wird. Ein Agent, der mit dem MCP ausgestattet ist, kann theoretisch mit jedem kompatiblen Tool kommunizieren, ohne spezifische Anpassungen vornehmen zu müssen.

Für Entwickler bedeutet dies eine erhebliche Vereinfachung: Anstatt für jede neue Tool-Integration eine eigene Schnittstelle zu programmieren, reicht es aus, das MCP-Protokoll zu implementieren. Dies reduziert nicht nur den Entwicklungsaufwand, sondern macht Agenten-Lösungen auch flexibler und wartungsfreundlicher.

Model Context Protocol

Model Context Protocol (Quelle: AMALYTIX)

Agentic Commerce Protocol

Während das MCP einen allgemeinen Standard für die Kommunikation setzt, entstehen für spezifische Branchen spezialisierte Protokolle. Ein konkretes Beispiel hierfür ist das Agentic Commerce Protocol (ACP).

ACP ist ein offener Standard, der speziell dafür entwickelt wurde, die direkte und sichere Kommunikation zwischen KI-Agenten (wie ChatGPT) und den Systemen von Online-Händlern zu ermöglichen. Das Ziel ist es, einen neuen Vertriebskanal zu schaffen, der es Kunden erlaubt, Produkte direkt innerhalb eines KI-Chats zu entdecken, zu vergleichen und zu kaufen, ohne eine Webseite besuchen zu müssen. Durch eine standardisierte Übermittlung von Produkt-Feeds und sicheren Zahlungs-Tokens können Händler ihre Systeme an eine Vielzahl von KI-Assistenten anbinden.

Mehr zu diesem Thema erfahren Sie in unserem Artikel über Agentic Commerce.

Wie lassen sich KI-Agenten erstellen?

No-Code-Plattformen

No-Code-Plattformen wie n8n, Zapier oder make.com ermöglichen es auch technischen Laien, eigene Agenten-Lösungen zu entwickeln, ohne Programmiersprachen beherrschen zu müssen. Diese Plattformen funktionieren nach dem Prinzip der visuellen Programmierung: Komplexe Workflows werden durch das Verbinden vorgefertigter Bausteine erstellt, ähnlich wie bei einem Flussdiagramm.

Die Funktionsweise basiert auf sogenannten “Nodes” oder “Zapier Steps”, die jeweils eine spezifische Funktion erfüllen. Ein Node kann beispielsweise eine E-Mail empfangen, ein anderer eine Datenbank abfragen, ein dritter ein Sprachmodell anfragen und ein vierter eine Antwort versenden. Diese Nodes werden per Drag & Drop auf einer visuellen Oberfläche platziert und durch Linien miteinander verbunden, die den Datenfluss und die Ausführungsreihenfolge definieren.

Für die Erstellung eines einfachen Kundenservice-Agenten würde man beispielsweise folgende Nodes verbinden: “E-Mail empfangen” → “Text analysieren” → “Sprachmodell anfragen” → “Antwort generieren” → “E-Mail versenden”. Die Plattform übernimmt dabei die gesamte technische Umsetzung, während der Nutzer sich auf die Logik und den Workflow konzentrieren kann. Zusätzlich bieten diese Plattformen vorgefertigte Integrationen zu Hunderten von Services, wodurch auch komplexe Agenten mit externen Systemen verbunden werden können.

Beispiel eines einfachen Agenten in n8n

Beispiel eines einfachen Agenten in n8n

Coding-Frameworks

Coding-Frameworks sind spezialisierte Bibliotheken und Tools, die Entwicklern dabei helfen, KI-Agenten programmatisch zu erstellen. Im Gegensatz zu No-Code-Plattformen bieten sie größere Flexibilität und Kontrolle, erfordern aber entsprechende Programmierkenntnisse.

Trotz ihrer Vorteile bringen Coding-Frameworks auch einige Herausforderungen mit sich. Viele Frameworks sind stark an bestimmte LLM-Provider oder Cloud-Services gebunden, was zu einem Vendor Lock-in führen kann, bei dem ein Wechsel erhebliche Refactoring-Aufwände bedeutet.

Zu den bekannteren Frameworks gehören:

  • LangChain/LangGraph: Das wohl bekannteste Framework bietet eine umfassende Sammlung von Tools und eine graph-basierte Architektur für komplexe Agenten-Workflows. Besonders stark in der Integration verschiedener LLM-Provider und der Orchestrierung von Multi-Agent-Systemen.
  • LlamaIndex: Spezialisiert auf die Erstellung von RAG-Systemen (Retrieval-Augmented Generation) und die Verarbeitung großer Dokumentenmengen. Ideal für Agenten, die mit umfangreichen Wissensdatenbanken arbeiten müssen.
  • CrewAI: Fokussiert auf Multi-Agent-Systeme, bei denen verschiedene Agenten mit spezifischen Rollen zusammenarbeiten. Bietet ausgeklügelte Orchestrierungsmechanismen für komplexe Aufgabenverteilung.
  • AutoGen: Microsofts Framework für Conversational AI, das besonders stark in der Erstellung von Chatbots und Dialog-Systemen ist.

Der Einsatz von Coding-Frameworks lohnt sich besonders bei komplexen, individuellen Anforderungen, wo die Flexibilität und Kontrolle überwiegen. Für einfache Use Cases können No-Code-Lösungen oder direkte API-Integrationen oft effizienter sein.

KI-Agenten in AMALYTIX

AMALYTIX hat einen spezialisierten Finanz KI-Agenten entwickelt, der Amazon Seller und Vendoren dabei unterstützt, komplexe Finanzdaten zu analysieren und marktrelevante Veränderungen zu erkennen. Dieser Agent greift über integrierte Tools auf umfangreiche Finanzauswertungen zu Märkten und Produkten zu und kann größere Veränderungen in den Verkaufsdaten selbstständig identifizieren.

Der Finanz KI-Agent analysiert auf Anfrage die Performance verschiedener Produktkategorien, Marktsegmente und individueller Artikel. Er erkennt automatisch signifikante Abweichungen in Umsätzen und analysiert die zugrundeliegenden Ursachen. So kann er beispielsweise feststellen, dass ein plötzlicher Umsatzrückgang bei einem Produkt auf eine geringere Sichtbarkeit bei ausgewählten Keywords zurückzuführen ist.

Die Bedienung erfolgt über ein intuitives Chat-Interface, das sowohl für Seller als auch für Vendoren zugänglich ist. Nutzer können dem Agenten direkte Fragen stellen wie “Welche Marktveränderungen haben sich in den letzten 30 Tagen ergeben?” Der Agent analysiert dann die relevanten Finanzdaten, erstellt detaillierte Auswertungen und liefert konkrete Handlungsempfehlungen, die auf den erkannten Mustern und Trends basieren.

Beispiel eines Agenten in AMALYTIX

Beispiel eines Agenten in AMALYTIX

Weiterführende Ressourcen

Die folgende Auswahl an kostenlosen Guides und Kursen bietet Ihnen die Möglichkeit, Ihr Wissen über KI-Agenten gezielt zu vertiefen.

Kostenlose KI-Agenten Guides

Kostenlose KI-Agenten Kurse

AMALYTIX KI-Workshop

AMALYTIX KI Workshop

AMALYTIX KI Workshop

Der AMALYTIX KI-Workshop vermittelt, wie Amazon Seller, Vendoren und Agenturen generative KI im Alltag einsetzen können – von Listing-Optimierung und Kundenfeedback-Analyse über Bilderstellung bis zur Datenanalyse. Der Workshop richtet sich an Teams, die direkt anwendbares Wissen suchen, um KI-Technologien gezielt für ihre Amazon-Prozesse nutzbar zu machen.

Das Format ist flexibel – wahlweise remote oder vor Ort im DACH‑Raum – und dauert ein bis zwei Tage. Gearbeitet wird mit Ihren eigenen Produktdaten, sodass alle Inhalte direkt anwendbar sind. Der Schwerpunkt liegt auf den Grundlagen moderner KI‑Modelle (z. B. ChatGPT, Gemini), effektivem Prompting sowie spezifischen Amazon‑Anwendungsfällen.

Interesse? Hier geht’s zum kostenlosen Erstgespräch.

FAQ

Wie funktioniert ein KI-Agent?

Ein KI-Agent kombiniert mehrere Softwarekomponenten zu einem handlungsfähigen System. Im Zentrum steht ein großes Sprachmodell (LLM), das als “Denker” agiert: Es analysiert das Ziel und trifft die Entscheidungen. Gesteuert wird der Prozess über einen “Agenten-Loop”, einen wiederkehrenden Zyklus aus Denken, Handeln und Bewerten. In jeder Wiederholung dieses Zyklus entscheidet der Agent, welches Werkzeug (z. B. eine API oder ein Browser) er als Nächstes nutzt, um dem übergeordneten Ziel schrittweise näherzukommen.

Sind KI-Agenten das Gleiche wie Chatbots?

Nein. Ein einfacher Chatbot reagiert nur auf direkte Eingaben. Ein KI-Agent hingegen verfolgt proaktiv ein Ziel. Er plant selbstständig, nutzt verschiedene Werkzeuge und führt Aktionen aus, anstatt nur zu antworten.

Was ist ein Multi-Agenten-System?

Hierbei arbeiten mehrere spezialisierte KI-Agenten als koordiniertes Team zusammen. Sie tauschen Informationen aus und übernehmen unterschiedliche Rollen, um komplexe Aufgaben effizienter zu lösen als ein einzelner Agent.

Sind KI-Agenten zuverlässig?

Die Technologie ist neu. Für klar definierte, repetitive Aufgaben (z. B. Datenrecherche und -aufbereitung) ist die Zuverlässigkeit bereits hoch. Bei komplexen, offenen Zielen können jedoch Fehler auftreten, weshalb eine menschliche Überwachung in jedem Fall unerlässlich bleibt.

Newsletter abonnieren

Erhalten Sie die neuesten Amazon-Tipps und Updates direkt in Ihr Postfach.

Wir respektieren Ihre Privatsphäre. Jederzeit abbestellbar.

Ähnliche Artikel