Was sind Large Action Models (LAMs)?
Wenn Sie die sprachliche Gewandtheit eines LLM mit der Fähigkeit kombinieren, Aufgaben zu erledigen und eigenständig zu entscheiden, wird generative KI zu einem aktiven Arbeitspartner.
Silvio Savarese
Wenn Sie die sprachliche Gewandtheit eines LLM mit der Fähigkeit kombinieren, Aufgaben zu erledigen und eigenständig zu entscheiden, wird generative KI zu einem aktiven Arbeitspartner.
Silvio Savarese
Ich glaube, dass Large Action Models (LAMs) einen ebenso großen Wandel in der Entwicklung der KI darstellen wie alles andere, was wir im letzten Jahrzehnt gesehen haben. So wie Large Language Models (LLMs) die Automatisierung der Texterstellung und – in ihrer multimodalen Form – etlicher Medien ermöglicht haben, könnten die LAMs bald ganze Prozesse automatisieren. Und da sie von Natur aus fließend Sprache beherrschen, werden sie besonders intelligent mit der Welt interagieren, mit Menschen kommunizieren, sich an veränderte Umstände anpassen und mit anderen LAMs kooperieren.
In den letzten Monaten hat sich ein neuer Trend herausgebildet, bei dem Large Language Models zu „Agenten“ erweitert werden. Das sind Softwareeinheiten, die eigenständig Aufgaben ausführen.Letztlich für ein bestimmtes Ziel und nicht nur als Antwort auf Anfragen von menschlichen Nutzer:innen. Es mag wie eine einfache Veränderung erscheinen, aber sie eröffnet ein ganzes Universum neuer Möglichkeiten. Durch die Kombination der sprachlichen Gewandtheit eines LLM mit der Fähigkeit, Aufgaben zu erledigen und eigenständig zu entscheiden, wird die generative KI von einem passiven Tool zu einem aktiven Partner, um Arbeit in Echtzeit zu erledigen. Hier bei Salesforce AI ist das Potenzial solcher leistungsstarken Agenten schon seit einiger Zeit ein Thema aktiver Forschung➚ und Entwicklung.
Ich glaube, dass ein wichtiger Auftrag der KI darin besteht, eine Automatisierung anzustreben, die die menschlichen Fähigkeiten ergänzt, anstatt sie zu ersetzen. Daher sollten sich LAMs auf repetitive Aufgaben und anderen Verwaltungsaufwand fokussieren. Einerseits wollen wir diese ohnehin nicht machen, andererseits benötigen wir dafür oft länger und noch dazu stehlen sie uns die Zeit, die wir mitsinnvollen, höherwertigen Aufgaben verbringen können. Lassen Sie uns das unglaubliche Potenzial von LAMs auf zwei Ebenen diskutieren: für Einzelpersonen und Organisationen. Stellen wir uns dabei vor, wie LAMs heute eingesetzt werden können und wie sich ihre Rolle in unserer Arbeit und in unserem Leben in den kommenden Jahren entwickeln könnte.
Ich glaube, dass ein wichtiger Auftrag der KI darin besteht, eine Automatisierung anzustreben, die die menschlichen Fähigkeiten ergänzt, anstatt sie zu ersetzen. Daher sollten sich LAMs auf repetitive Aufgaben und anderen Verwaltungsaufwand fokussieren – was die meisten von uns gar nicht erst machen wollen –, der uns bei den sinnvollen, höherwertigen Aufgaben, in denen wir am besten sind, im Weg steht. Lassen Sie uns das unglaubliche Potenzial von LAMs auf zwei Ebenen diskutieren: für Einzelpersonen und Organisationen. Stellen wir uns dabei vor, wie LAMs heute eingesetzt werden können und wie sich ihre Rolle in unserer Arbeit und in unserem Leben in den kommenden Jahren entwickeln könnte.
Persönliche Assistenten sind seit Generationen ein Luxus, der den Wohlhabenden vorbehalten ist, obwohl die Tech-Branche schon seit Jahrzehnten virtuelle Alternativen für die breite Masse verspricht. LAMs sind erstaunlich gewandt und können auf natürliche Weise über praktisch alle Lebensbereiche hinweg agieren. Das könnte der Wendepunkt sein, auf den wir gewartet haben – eine Technologie, die uns wirklich helfen kann. Und zwar mit einem Großteil der Voraussicht und des Scharfsinns, die wir von Menschen erwarten würden. Bedenken Sie Folgendes:
Die Fähigkeit von LLMs, Texte, Bilder und sogar Weblayouts zu erstellen, gilt als entscheidender Fortschritt. In der Praxis ist es jedoch komplizierter, da viel manuelle Arbeit erforderlich ist, um die Ergebnisse eines LLM in den gesamten Prozess zu integrieren – wie eine neue Kampagne zu konzipieren und umzusetzen. Derzeit kann selbst die beste generative KI nur ausgewählte Teile dieses Prozesses wirklich automatisieren.
Wir stellen uns jedoch vor, dass KI-Agenten für das Marketing einen umfassenderen, LAM-ähnlicheren Ansatz verfolgen, um Ergebnisse für Marketingteams zu liefern. Und zwar, indem sie eine LLM-Schnittstelle nutzen und so Daten, Tools und domänenspezifische Agenten bei der Verfolgung einer übergeordneten Aufgabe verbinden. Denken Sie beispielsweise an eine Anfrage wie diese:
„Sende eine Marketing-E-Mail, um den Wert unserer neuen Schokolade hervorzuheben. Gib den ersten 100 Käufern einen Gutschein für kostenlosen Versand. Stelle sicher, dass jeder Empfänger eine personalisierte Nachricht erhält.“
Allein könnte ein LLM die Aufgabe nur schwer erfüllen. Eine Konstellation von Tools, Agenten und Datenquellen – der Zugriff auf frühere Marketingmaterialien, Kundendaten, die das Unternehmen mit dem LAM und natürlich den LLMs geteilt hat – könnte
Persönliche Assistenten sollen das ganze Leben erleichtern, nicht nur die Arbeit. Stellen wir uns also vor, wie sie bei einer wichtigen persönlichen Kaufentscheidung helfen könnten. Für viele ist der Kauf eines Fahrzeugs eher lästig als aufregend. Vor allem die Recherchephase kann überfordern. Mit einem LAM könnte es jedoch bald nicht mehr als eine Eingabeaufforderung wie diese erfordern:
Ich suche einen Kombi mit einer guten Sicherheitsbewertung und viel Platz, idealerweise in einer dunklen Farbe. Baujahr ab 2014 und nicht teurer als 28.000 Euro. Mit einem Kilometerstand von unter 90.000.
Der erste Schritt, sowohl für einen Menschen als auch für ein LAM, wäre es, Websites für den Autokauf zu durchsuchen, um eine erste Liste von Optionen zusammenzustellen. Durch das leistungsstarke Textverständnis eines LLM kann der Agent riesige Mengen an Autobewertungen aus professionellen und nutzergenerierten Quellen verarbeiten und schnell die Fahrzeuge identifizieren, die den Parametern des Nutzers oder der Nutzerin entsprechen. Zusätzlich könnte das LAM Warnsignale erkennen. Beispielsweise erkennt das LAM, dass ein bestimmtes Jahr eines ansonsten geeigneten Automodells für fehlerhafte Getriebe oder elektrische Probleme berüchtigt ist. DiesesFahrzeug wird entweder aus der Liste entfern oder zumindest mit einem Hinweis versehen.
Im nächsten Schritt könnte das LAM sogar Gespräche mit privaten Verkäufer:innen und lokalen Händler:innen über Kanäle wie E-Mail oder sogar SMS aufnehmen. Obwohl ein gutes LAM wahrscheinlich mitteilen würde, dass es eine KI ist, um sicherzustellen, dass Menschen nicht in die Irre geführt werden, würde es dennoch eindeutig, flüssig und natürlich kommunizieren – mit Begrüßungen, vollständigen Sätzen und einer klaren Bitte oder Aussage in jeder Nachricht. Es kann sogar die Bank des Nutzers oder der Nutzerin darüber informieren, dass ein Kredit aufgenommen werden soll. Wenn sich der Vorgang der Entscheidungsfindung nähert, wird der:die Nutzer:in zur endgültigen Genehmigung hinzugezogen.
Letztendlich will Salesforce AI die Kraft der Technologie nutzen, um die Arbeitsweise von Unternehmen jeder Größe zu verbessern. LAMs sind ein großartiges Beispiel dafür, wie das in den kommenden Jahren aussehen könnte. Ich bin zuversichtlich, dass diese Vision jeden betrieblichen Aspekt umfassen wird, vom Backoffice bis hin zum Marketing. Das Spektrum schließtAnwendungen ein, die wir uns noch gar nicht vorstellen können. Aber es gibt wahrscheinlich kein besseres Beispiel als die Interaktion mit Kund:innen.
Stellen Sie sich beispielsweise einen Agenten bei einem Versicherungsunternehmen vor. Einen Großteil des Arbeitstages würde ein solcher Agent mit bestehenden und potenziellen Kund:innen verbringen, um deren Bedürfnisse zu besprechen und die Beziehung zu ihnen auszubauen. Das Herzstück des Prozesses ist die menschliche Note, die nur echte Mitarbeiter:innen bieten können. Allerdings gibt es zahlreiche repetitive Aufgaben, die ein LAM drastisch beschleunigen könnte. Stellen Sie sich den folgenden Ablauf vor, der von einem Schritt zum nächsten durch generative KI erweitert wird:
Ich denke, das ist eine überzeugende Vision des individuellen Empowerments. Aber die wirkliche Transformation erfolgt erst durch die Skalierbarkeit der LAMs. Stellen Sie sich vor, ein Unternehmen würde seine Mitarbeiter:innen ganzheitlich mit solch ausgefeilten Tools ausstatten. Wie viel Zeit und Kosten insgesamt eingespart werden können. Ganz zu schweigen davon, wie die Vorschläge von LAM helfen können, Fehler zu vermeiden, erfolgreiche Strategien zu empfehlen und vieles mehr. Diese Technologie kann in jeder Größenordnung echten Mehrwert liefern.
Bisher haben wir über LAMs für einzelne Nutzer:innen gesprochen, aber es gibt noch viele weitere Formen dieser Technologie. Es ist ebenso leicht vorstellbar, dass Gruppen oder sogar ganze Organisationen von LAMs profitieren. Und obwohl alle LAMs flexibel sind, erwarte ich eine breite Palette von Möglichkeiten, die von sehr allgemeinen bis hin zu hochgradig maßgeschneiderten, domänenspezifischen Agenten für Nischenprobleme reichen. Die allermeisten LAMs werden so konzipiert sein, dass sie aus ihren Erfahrungen lernen. Sei es, dass sie immer mehr Fachwissen bei der Lösung eines organisatorischen Problems sammeln oder dass sie immer individueller auf die Bedürfnisse und Präferenzen der einzelnen Nutzer:innen eingehen.
Wer sagt, dass LAMs immer einzeln agieren? Es ist denkbar, dass mehrere LAMs zusammenarbeiten, wobei jedes für eine andere Zielsetzung optimiert ist. Und ein weiteres LAM übernimmt die Aufgabe, die einzelnen Bemühungen zu orchestrieren und mit Benutzer:innen zu kommunizieren. Ganz egal, ob mit einer Einzelperson, einem Team oder sogar einer ganzen Organisation. Anders ausgedrückt: Es wäre ein Upgrade von einem persönlichen Assistenten zu einem kompletten Team, das ein „Chief of Staff“ leitet, der dem:der zuständigen Mitarbeiter:in unterstellt ist.
Die Möglichkeiten werden noch interessanter, wenn wir LAMs betrachten, die nur zu dem Zweck geschaffen wurden, mit anderen LAMs oder Teams von LAMs zu interagieren. Stellen Sie sich einen Agenten vor, der von einem der Autohäuser aus dem obigen Beispiel eingesetzt wird und die eingehenden Anfragen von den persönlichen LAMs bearbeitet, die potenzielle Kund:innen repräsentieren. Oder mit den LAMs interagiert, die die Autohersteller vertreten. Sie würden zwar die Transparenz und die allgemeine Anwendung beibehalten, die LAMs so wertvoll machen, insbesondere wenn man ihr Verhalten im Nachhinein bewertet. Aber sie würden mit der weitaus höheren Geschwindigkeit und Effizienz arbeiten, die die Maschine-zu-Maschine-Kommunikation ermöglicht.
Finden Sie heraus, wie viel Zeit und Geld Sie mit einem Team von KI-gestützten Agenten sparen können, die Seite an Seite mit Ihren Mitarbeiter:innen und Ihrer Belegschaft arbeiten. Beantworten Sie ein paar einfache Fragen, um zu sehen, was mit Agentforce möglich ist.
Obwohl noch viele technische Hürden zu überwinden sind, um die volle Leistungsfähigkeit von LAMs zu erreichen, ist die Kernherausforderung klar: Die Welt ist kein statischer Ort, und jeder Agent, der mit ihr interagieren soll, muss flexibel genug sein, um sich elegant an veränderte Umstände anzupassen. Für unseren beispielhaften Autokauf bedeutet das, die Leads zu überwachen und zu erkennen, wann ein begehrtes Auto verkauft wurde, bevor der:die Nutzer:in die Chance hatte, ein Angebot zu machen. Oder sogar die Vorschläge zu aktualisieren, wenn mitten im Rechercheprozess ein Rückruf erfolgt. Bei unserem Beispiel einer Versicherungsagentur ist die Kenntnis aktueller Ereignisse – insbesondere solcher, die in der Nähe des:der Kund:in stattfinden – entscheidend, um nützliche, aktuelle Informationen bereitzustellen, die von Änderungen der gesetzlichen Bestimmungen bis hin zu extremen Wetterereignissen reichen.
In jedem Fall sollte ein gutes LAM immer wissen, wann es den Menschen benachrichtigen oder um Klärung bitten muss. Tut es das zu oft, kann es lästig und störend sein und sogar die Vorteile eines LAM zunichtemachen. Zu selten? Dann ist fast garantiert, dass potenziell schwerwiegende, unerwünschte Nebeneffekte auftreten – vom Löschen einer wichtigen E-Mail bis hin zur Beantragung eines unerwünschten Kredits bei der eigenen Bank. Wie ein guter persönlicher Assistent braucht auch ein LAM einen sicheren Instinkt, um die richtige Balance zu finden.
Deshalb sollten wir eine der stärksten Eigenschaften von LAMs nutzen – die Fähigkeit zu lernen. Da LAMs mehr und mehr Erfahrungen in der realen Welt sammeln und mit uns zusammenarbeiten, können sie ihr Verhalten durch menschliches Feedback weiter verfeinern. Darüber hinaus können LAMs wertvolle Interpretationen von Abläufen und Prozessen extrahieren, indem sie Daten von Kundenservice-Transkriptionen bis hin zu Ereignisprotokollen durchforsten und die idealen Schritte zusammentragen, die einen bestimmten Ausgangspunkt mit dem wünschenswertesten Ergebnis verbinden.
Um es klar zu sagen: Die Aufgabe eines LAM besteht nicht nur darin, eine Anfrage in eine Reihe von Schritten umzuwandeln, sondern auch die Logik zu verstehen, die diese Schritte miteinander verbindet und umgibt. Also zu verstehen, warum ein Schritt vor oder nach einem anderen erfolgen muss, und zu wissen, wann der Plan geändert werden muss, um neuen Umständen gerecht zu werden. Diese Fähigkeit stellen wir im Alltag ständig unter Beweis. Wenn wir beispielsweise nicht genug Eier haben, um ein Omelett zu machen, wissen wir, dass der erste Schritt nicht das Kochen ist, sondern der Gang zum Supermarkt. Es wird Zeit, dass wir eine Technologie entwickeln, die das auch kann.
Es steht außer Frage, dass LAMs so sprachgewandt und kommunikativ werden, wie es viele der oben genannten Beispiele erfordern würden. Aber es ist immer noch nicht sicher, ob man sich darauf verlassen kann, dass sie sich zuverlässig, effektiv und mit der für den regelmäßigen Einsatz in der realen Welt erforderlichen Konsistenz verhalten.
Wenn Vertrauen schon bei der Erstellung von Texten und Bildern eine Herausforderung ist – und das ist es zweifellos –, dann ist es noch größer, wenn es um konkrete Maßnahmen geht. Je mehr LAMs zusammenarbeiten, desto anspruchsvoller ist es, Sicherheit und Zuverlässigkeit zu gewährleisten. Deshalb halte ich es für unabdingbar, dass LAMs, selbst wenn sie sehr unabhängig sind, so konzipiert werden, dass sie den Menschen einbeziehen, bevor kritische Maßnahmen ergriffen werden. Egal, wie fortgeschritten die Technologie ist, ich stelle sie mir als ein Tool vor – wenn auch ein außergewöhnlich intelligentes –, das der Mensch immer nach seinem Ermessen steuern kann.
Transformieren Sie die Art und Weise, wie Arbeit über alle Rollen, Arbeitsabläufe und Branchen hinweg erledigt wird, mit autonomen KI-Agents.
Nach einem historischen Jahrzehnt der KI-Entwicklungen, spricht es geradezu für das Potenzial von LAMs, dass so viele von uns in der Forschung glauben, die größten Veränderungen würden erst noch kommen. Ich glaube, dass LAMs eine neue Ära der Produktivität, Leichtigkeit und Klarheit einläuten können, wenn sie richtig angeleitet werden. Denn sie machen uns besser bei Aufgaben, die wir besonders schätzen, und befreien uns von denen, die wir nicht mögen.
Ein besonderer Dank geht an Alex Michael, Peter Schwartz und das Salesforce Futures-Team für ihren Input zum Verfassen dieses Artikels.
Informieren Sie sich in unserer Bibliothek über das Konfigurieren von KI-Assistenten.
Führen Sie Agentforce ein – schnell, sicher und mit messbarem ROI.
Erzählen Sie uns von Ihren Geschäftsanforderungen. Wir freuen uns darauf, Sie zu beraten.