
Was sind Large Action Models (LAMs)?
Wenn Sie die sprachliche Gewandtheit eines LLM mit der Fähigkeit kombinieren, Aufgaben zu erledigen und eigenständig zu entscheiden, wird generative KI zu einem aktiven Arbeitspartner.
Silvio Savarese
Wenn Sie die sprachliche Gewandtheit eines LLM mit der Fähigkeit kombinieren, Aufgaben zu erledigen und eigenständig zu entscheiden, wird generative KI zu einem aktiven Arbeitspartner.
Silvio Savarese
Ich glaube, dass Large Action Models (LAMs) einen ebenso großen Wandel in der Entwicklung der KI darstellen wie alles andere, was wir im letzten Jahrzehnt gesehen haben. So wie LLMs die Automatisierung der Texterstellung und – in ihrer multimodalen Form – etlicher Medien ermöglicht haben, könnten die LAMs bald ganze Prozesse automatisieren. Und da sie von Natur aus fließend Sprache beherrschen, werden sie besonders intelligent mit der Welt interagieren – mit Menschen kommunizieren, sich an veränderte Umstände anpassen und sogar mit anderen LAMs kooperieren.
In den letzten Monaten hat sich ein neuer Trend herausgebildet, bei dem Large Language Models zu „Agenten“ erweitert werden. Das sind Softwareeinheiten, die eigenständig Aufgaben ausführen – letztlich für ein bestimmtes Ziel und nicht nur als Antwort auf Anfragen von menschlichen Nutzer:innen. Es mag wie eine einfache Veränderung erscheinen, aber sie eröffnet ein ganzes Universum neuer Möglichkeiten. Durch die Kombination der sprachlichen Gewandtheit eines LLM mit der Fähigkeit, Aufgaben zu erledigen und eigenständig zu entscheiden, wird die generative KI von einem passiven Tool, so leistungsfähig es auch sein mag, zu einem aktiven Partner bei, um Arbeit in Echtzeit zu erledigen. Hier bei Salesforce AI ist das Potenzial solcher leistungsstarken Agenten schon seit einiger Zeit ein Thema aktiver Forschung➚ und Entwicklung.
Vernetzen Sie sich in unserer Community mit Agentblazern aus der ganzen Welt. Hier können Sie Ihre KI-Kompetenz erweitern, Anwendungsfälle entdecken, von Produktexpert:innen hören und vieles mehr. Fördern Sie Ihr KI-Know-how – und Ihre Karriere.
Einfach ausgedrückt ist ein Large Action Model (LAM) eine Art generative KI, die basierend auf Nutzeranfragen bestimmte Aktionen ausführen kann. Solche Modelle analysieren nicht nur Daten, sondern handeln auch anhand der Ergebnisse. Betrachten Sie sie als Pendant zu Large Language Models (LLMs). Ein LLM könnte Text als Antwort auf eine Anfrage generieren, während ein LAM Maßnahmen ergreift➚ – beispielsweise einem:einer Kund:in bei einer Retoure helfen.
Ich glaube, dass ein wichtiger Auftrag der KI darin besteht, eine Automatisierung anzustreben, die die menschlichen Fähigkeiten ergänzt, anstatt sie zu ersetzen. Daher sollten sich LAMs auf repetitive Aufgaben und anderen Verwaltungsaufwand fokussieren – was die meisten von uns gar nicht erst machen wollen –, der uns bei den sinnvollen, höherwertigen Aufgaben, in denen wir am besten sind, im Weg steht. Lassen Sie uns das unglaubliche Potenzial von LAMs auf zwei Ebenen diskutieren: für Einzelpersonen und Organisationen. Stellen wir uns dabei vor, wie LAMs heute eingesetzt werden können und wie sich ihre Rolle in unserer Arbeit und in unserem Leben in den kommenden Jahren entwickeln könnte.
Persönliche Assistenten sind seit Generationen ein Luxus, der den Wohlhabenden vorbehalten ist, obwohl die Techbranche schon seit Jahrzehnten virtuelle Alternativen für die breite Masse verspricht. LAMs sind erstaunlich gewandt und können auf natürliche Weise über praktisch alle Lebensbereiche hinweg agieren. Das könnte der Wendepunkt sein, auf den wir gewartet haben – eine Technologie, die uns wirklich helfen kann. Und zwar mit einem Großteil der Voraussicht und des Scharfsinns, die wir von Menschen erwarten würden. Bedenken Sie Folgendes:
In letzter Zeit wurde viel darüber gesprochen, wie sich LLMs auf die Workflows im Marketing auswirken. Ihre Fähigkeit, Texte, Bilder und sogar Weblayouts zu erstellen, gilt als entscheidender Fortschritt. In der Praxis ist es jedoch komplizierter, da viel manuelle Arbeit erforderlich ist, um die Ergebnisse eines LLM in den gesamten Prozess zu integrieren – wie eine neue Kampagne zu konzipieren und umzusetzen. Derzeit kann selbst die beste generative KI nur ausgewählte Teile dieses Prozesses wirklich automatisieren.
Wir stellen uns jedoch vor, dass KI-Agenten für das Marketing einen umfassenderen, LAM-ähnlicheren Ansatz verfolgen, um Ergebnisse für Marketingteams zu liefern, indem sie eine LLM-Schnittstelle nutzen – und so Daten, Tools und domänenspezifische Agenten bei der Verfolgung einer übergeordneten Aufgabe verbinden. Denken Sie beispielsweise an eine Anfrage wie diese:
„Sende eine Marketing-E-Mail, um den Wert unserer neuen Schokolade hervorzuheben. Gib den ersten 100 Käufern einen Gutschein für kostenlosen Versand. Stelle sicher, dass jeder Empfänger eine personalisierte Nachricht erhält.“
Allein könnte ein LLM die Aufgabe nur schwer erfüllen. Eine Konstellation von Tools, Agenten und Datenquellen – der Zugriff auf frühere Marketingmaterialien, Kundendaten, die das Unternehmen mit dem LAM und natürlich den LLMs geteilt hat – könnte den Text generieren („Sende eine Marketing-E-Mail“), aus der Dokumentation über die neuesten Produktentwicklungen schöpfen („den Wert unserer neuen Schokolade“), die Logik der Anfrage aufschlüsseln („Gib den ersten 100 Käufern einen Gutschein“) und kundenspezifische Anpassungen („Stelle sicher, dass jeder Empfänger eine personalisierte Nachricht erhält“) mit Leichtigkeit vornehmen.
Aber persönliche Assistenten sollen das ganze Leben erleichtern, nicht nur die Arbeit. Stellen wir uns also vor, wie sie bei einer wichtigen persönlichen Kaufentscheidung helfen könnten – beispielsweise bei einem Auto. Für viele ist der Kauf eines Fahrzeugs eher lästig als aufregend, und vor allem die Recherchephase kann überfordern. Mit einem LAM könnte es jedoch bald nicht mehr als eine Eingabeaufforderung wie diese erfordern:
Ich suche einen Kombi mit einer guten Sicherheitsbewertung und viel Platz, idealerweise in einer dunklen Farbe. Nicht früher als 2014 und nicht teurer als 28.000 Euro. Mit einem Kilometerstand von unter 90.000.
Der erste Schritt, sowohl für einen Menschen als auch für ein LAM, wäre es, Websites für den Autokauf zu durchsuchen, um eine erste Liste von Optionen zusammenzustellen. Durch das leistungsstarke Textverständnis eines LLM kann der Agent riesige Mengen an Autobewertungen aus professionellen und nutzergenerierten Quellen verarbeiten und schnell die Kandidaten identifizieren, die den Parametern des Nutzers oder der Nutzerin entsprechen. Zusätzlich könnte das LAM Warnsignale erkennen – beispielsweise, dass ein bestimmtes Jahr eines ansonsten geeigneten Automodells für fehlerhafte Getriebe oder elektrische Probleme berüchtigt ist – und das Fahrzeug aus der Liste entfernen oder zumindest mit einem Hinweis versehen.
Im nächsten Schritt könnte das LAM sogar Gespräche mit privaten Verkäufer:innen und lokalen Händler:innen über Kanäle wie E-Mail oder sogar SMS aufnehmen. Obwohl ein gutes LAM wahrscheinlich mitteilen würde, dass es eine KI ist, um sicherzustellen, dass Menschen nicht in die Irre geführt werden, würde es dennoch eindeutig, flüssig und natürlich kommunizieren – mit Begrüßungen, vollständigen Sätzen und einer klaren Bitte oder Aussage in jeder Nachricht. Es kann sogar die Bank des Nutzers oder der Nutzerin darüber informieren, dass ein Kredit aufgenommen werden soll. Wenn sich der Vorgang der Entscheidungsfindung nähert, wird der:die Nutzer:in zur endgültigen Genehmigung hinzugezogen.
Letztendlich will Salesforce AI die Kraft der Technologie nutzen, um die Arbeitsweise von Unternehmen jeder Größe zu verbessern – und LAMs sind ein großartiges Beispiel dafür, wie das in den kommenden Jahren aussehen könnte. Ich bin zuversichtlich, dass diese Vision jeden betrieblichen Aspekt umfassen wird, vom Backoffice bis hin zum Marketing – einschließlich Anwendungen, die wir uns noch gar nicht vorstellen können. Aber es gibt wahrscheinlich kein besseres Beispiel als die Interaktion mit Kund:innen.
Stellen Sie sich beispielsweise einen Agenten bei einem Versicherungsunternehmen vor. Einen Großteil des Arbeitstages würde ein solcher Agent mit bestehenden und potenziellen Kund:innen verbringen, um deren Bedürfnisse zu besprechen und die Beziehung zu ihnen auszubauen. Das Herzstück des Prozesses ist die menschliche Note, die nur echte Mitarbeiter:innen bieten können. Allerdings gibt es zahlreiche repetitive Aufgaben, die ein LAM drastisch beschleunigen könnte. Stellen Sie sich den folgenden Ablauf vor, der von einem Schritt zum nächsten durch generative KI erweitert wird:
Ich denke, das ist eine überzeugende Vision des individuellen Empowerments, aber die wirkliche Transformation erfolgt erst durch die Skalierbarkeit der LAMs. Stellen Sie sich vor, ein Unternehmen würde seine Mitarbeiter:innen ganzheitlich mit solch ausgefeilten Tools ausstatten – wie viel Zeit und Kosten insgesamt eingespart werden können. Ganz zu schweigen davon, wie die Vorschläge von LAM helfen können, Fehler zu vermeiden, erfolgreiche Strategien zu empfehlen und vieles mehr. Diese Technologie kann in jeder Größenordnung echten Mehrwert liefern.
Bisher haben wir über LAMs für einzelne Nutzer:innen gesprochen, aber es gibt noch viele weitere Formen dieser Technologie. Es ist ebenso leicht vorstellbar, dass Gruppen oder sogar ganze Organisationen von LAMs profitieren. Und obwohl alle LAMs flexibel sind, erwarte ich eine breite Palette von Möglichkeiten, die von sehr allgemeinen – analog zu den oben beschriebenen Konzepten der „Executive Assistants“ – bis hin zu hochgradig maßgeschneiderten, domänenspezifischen Agenten für Nischenprobleme reichen. Und viele LAMs – letztendlich alle – werden so konzipiert sein, dass sie aus ihren Erfahrungen lernen. Sei es, dass sie immer mehr Fachwissen bei der Lösung eines organisatorischen Problems sammeln oder dass sie immer individueller auf die Bedürfnisse und Präferenzen der einzelnen Nutzer:innen eingehen.
Und wer sagt, dass LAMs immer einzeln agieren? Es ist ebenso denkbar, dass mehrere LAMs zusammenarbeiten, wobei jedes für eine andere Zielsetzung optimiert ist. Und ein weiteres LAM übernimmt die Aufgabe, die einzelnen Bemühungen zu orchestrieren und mit Benutzer:innen zu kommunizieren – ob mit einer Einzelperson, einem Team oder sogar einer ganzen Organisation. Anders ausgedrückt: Es wäre ein Upgrade von einem persönlichen Assistenten zu einem kompletten Team, das ein „Chief of Staff“ leitet, der dem:der zuständigen Mitarbeiter:in unterstellt ist.
Die Möglichkeiten werden noch interessanter, wenn wir LAMs betrachten, die nur zu dem Zweck geschaffen wurden, mit anderen LAMs oder Teams von LAMs zu interagieren. Stellen Sie sich einen Agenten vor, der von einem der Autohäuser aus dem obigen Beispiel eingesetzt wird und die eingehenden Anfragen von den persönlichen LAMs bearbeitet, die potenzielle Kund:innen repräsentieren, oder mit den LAMs interagiert, die die Autohersteller vertreten. Sie würden zwar die Transparenz und die allgemeine Anwendung beibehalten, die alle LAMs so wertvoll machen, insbesondere wenn man ihr Verhalten im Nachhinein bewertet, aber sie würden mit der weitaus höheren Geschwindigkeit und Effizienz arbeiten, die die Maschine-zu-Maschine-Kommunikation ermöglicht.
Finden Sie heraus, wie viel Zeit und Geld Sie mit einem Team von KI-gestützten Agenten sparen können, die Seite an Seite mit Ihren Mitarbeiter:innen und Ihrer Belegschaft arbeiten. Beantworten Sie ein paar einfache Fragen, um zu sehen, was mit Agentforce möglich ist.
Obwohl noch viele technische Hürden zu überwinden sind, um die volle Leistungsfähigkeit von LAMs zu erreichen, ist die Kernherausforderung klar: Die Welt ist kein statischer Ort, und jeder Agent, der mit ihr interagieren soll, muss flexibel genug sein, um sich elegant an veränderte Umstände anzupassen. Für unseren beispielhaften Autokauf bedeutet das, die Leads zu überwachen und zu erkennen, wann ein begehrtes Auto verkauft wurde, bevor der:die Nutzer:in die Chance hatte, ein Angebot zu machen. Oder sogar die Vorschläge zu aktualisieren, wenn mitten im Rechercheprozess ein Rückruf erfolgt. Bei unserem Beispiel einer Versicherungsagentur ist die Kenntnis aktueller Ereignisse – insbesondere solcher, die in der Nähe des:der Kund:in stattfinden – entscheidend, um nützliche, aktuelle Informationen bereitzustellen, die von Änderungen der gesetzlichen Bestimmungen bis hin zu extremen Wetterereignissen reichen.
In jedem Fall sollte ein gutes LAM immer wissen, wann es den Menschen benachrichtigen oder um Klärung bitten muss. Tut es das zu oft, kann es lästig und störend sein und sogar die Vorteile eines LAM zunichtemachen. Zu selten? Dann ist fast garantiert, dass potenziell schwerwiegende, unerwünschte Nebeneffekte auftreten – vom Löschen einer wichtigen E-Mail bis hin zur Beantragung eines unerwünschten Kredits bei der eigenen Bank. Wie ein guter persönlicher Assistent braucht auch ein LAM einen sicheren Instinkt, um die richtige Balance zu finden.
Deshalb sollten wir eine der stärksten Eigenschaften von LAMs nutzen – die Fähigkeit zu lernen. Da LAMs mehr und mehr Erfahrungen in der realen Welt sammeln und mit uns zusammenarbeiten, können sie ihr Verhalten durch menschliches Feedback weiter verfeinern. Darüber hinaus können LAMs wertvolle Interpretationen von Abläufen und Prozessen extrahieren, indem sie Daten von Kundenservice-Transkriptionen bis hin zu Ereignisprotokollen durchforsten und die idealen Schritte zusammentragen, die einen bestimmten Ausgangspunkt mit dem wünschenswertesten Ergebnis verbinden.
Um es klar zu sagen: Die Aufgabe eines LAM besteht nicht nur darin, eine Anfrage in eine Reihe von Schritten umzuwandeln, sondern auch die Logik zu verstehen, die diese Schritte miteinander verbindet und umgibt. Also zu verstehen, warum ein Schritt vor oder nach einem anderen erfolgen muss, und zu wissen, wann der Plan geändert werden muss, um neuen Umständen gerecht zu werden. Diese Fähigkeit stellen wir im Alltag ständig unter Beweis. Wenn wir beispielsweise nicht genug Eier haben, um ein Omelett zu machen, wissen wir, dass der erste Schritt nicht das Kochen ist, sondern der Gang zum Supermarkt. Es wird Zeit, dass wir eine Technologie entwickeln, die das auch kann.
Es steht außer Frage, dass LAMs so sprachgewandt und kommunikativ werden, wie es viele der oben genannten Beispiele erfordern würden. Aber es ist immer noch nicht sicher, ob man sich darauf verlassen kann, dass sie sich zuverlässig, effektiv und mit der für den regelmäßigen Einsatz in der realen Welt erforderlichen Konsistenz verhalten.
Wenn Vertrauen schon bei der Erstellung von Texten und Bildern eine Herausforderung ist – und das ist es zweifellos –, dann ist es noch größer, wenn es um konkrete Maßnahmen geht. Und je mehr LAMs zusammenarbeiten, desto anspruchsvoller ist es, Sicherheit und Zuverlässigkeit zu gewährleisten. Deshalb halte ich es für unabdingbar, dass LAMs, selbst wenn sie sehr unabhängig sind, so konzipiert werden, dass sie den Menschen einbeziehen, bevor kritische Maßnahmen ergriffen werden. Egal, wie fortgeschritten die Technologie ist, ich stelle sie mir als ein Tool vor – wenn auch ein außergewöhnlich intelligentes –, das der Mensch immer nach seinem Ermessen steuern kann.
Transformieren Sie die Art und Weise, wie Arbeit über alle Rollen, Arbeitsabläufe und Branchen hinweg erledigt wird, mit autonomen KI-Agents.
Nach einem Jahrzehnt der KI-Entwicklungen, das nichts weniger als historisch war, spricht es geradezu für das Potenzial von LAMs, dass so viele von uns in der Forschung glauben, die größten Veränderungen würden erst noch kommen. Ich glaube, dass LAMs eine neue Ära der Produktivität, Leichtigkeit und Klarheit einläuten können, wenn sie richtig angeleitet werden und die Menschen befähigen. Denn sie machen uns besser bei Aufgaben, die wir besonders schätzen, und befreien uns von denen, die wir nicht mögen. Und mit ihrer jahrzehntelangen Geschichte in der Unternehmenswelt kann ich mir keinen besseren Ort als Salesforce vorstellen, um diese Vision zu verwirklichen.
Ein besonderer Dank geht an Alex Michael, Peter Schwartz und das Salesforce-Futures-Team für ihren Beitrag zum Verfassen dieses Artikels.
Informieren Sie sich in unserer Bibliothek über das Konfigurieren von KI-Assistenten.
Führen Sie Agentforce ein – schnell, sicher und mit messbarem ROI.
Erzählen Sie uns von Ihren Geschäftsanforderungen. Wir freuen uns darauf, Sie zu beraten.