Servicekonsole mit einem Chat-Fenster, in dem Einstein bei der Beantwortung von Fragen hilft

Wie die Atlas Reasoning Engine Agentforce antreibt

Autonome, proaktive KI-Agenten sind das Herzstück der Agentforce. Aber wie funktionieren sie? 

Shipra Gupta

Die Innovationsgeschwindigkeit in der Welt der KI – und insbesondere der generativen KI – schreitet in rasantem Tempo voran. Mit der Technologie, die jetzt verfügbar ist, entwickelt sich die Branche rasant - von der assistiven Konversationsautomatisierung zur rollenbasierten Automatisierung, die die Belegschaft erweitert. Damit künstliche Intelligenz (KI) eine Leistung auf menschlichem Niveau nachahmen kann, ist es wichtig zu verstehen, was Menschen bei der Erledigung von Aufgaben am effektivsten macht: Handlungsfähigkeit. Menschen können Daten aufnehmen, über mögliche Wege nachdenken und Maßnahmen ergreifen. Die Ausstattung von KI mit einer solchen Handlungsfähigkeit erfordert ein extrem hohes Maß an Intelligenz und Entscheidungsfindung.

Bei Salesforce haben wir die neuesten Fortschritte der Large Language Models (LLMs) genutzt, um Agentforce auf den Markt zu bringen. Bei Agentforce handelt es sich um eine Suite von sofort einsatzbereiten KI-Agenten – autonome, proaktive Anwendungen, die für die Ausführung spezieller Aufgaben entwickelt wurden – und eine Reihe von Tools, um sie zu erstellen und anzupassen. Diese autonomen KI-Agenten können auf einem hohen Niveau denken, argumentieren, planen und orchestrieren. Agentforce stellt einen Quantensprung in der KI-Automatisierung für Kundenservice, Vertrieb, Marketing, Handel und mehr dar.

In diesem Artikel geht es um die Innovationen, die die Atlas Reasoning Engine ermöglicht – das von Salesforce AI Research entwickelte „Gehirn“ von Agentforce, das Aktionen intelligent und autonom orchestriert und Unternehmen einen KI-Agenten der Extraklasse bietet.

Ein Screenshot zeigt einen Agentforce Kalkulator, der errechnet, wie viel Geld man sich mit Agentforce sparen kann.

Berechnen Sie Ihren ROI für Agentforce.

Finden Sie heraus, wie viel Zeit und Geld Sie mit einem Team von KI-gestützten Agenten sparen können, die Seite an Seite mit Ihren Mitarbeiter:innen arbeiten. Beantworten Sie einfach vier schnelle Fragen und erfahren Sie, was mit Agentforce möglich ist.

Die Weiterentwicklung von Agentforce Assistant zu Agentforce

Anfang des letzten Jahres haben wir Agentforce Assistant herausgebracht. Das System hat sich mittlerweile zu einem Agentforce-Agenten für Customer Relationship Management (CRM) entwickelt. Agentforce Assistant war ein auf generative KI-gestützter Konversationsassistent, der seine Intelligenz aus einem Mechanismus namens Chain-of-Thought Reasoning (CoT) ableitete. Dabei ahmt das KI-System die Entscheidungsfindung nach menschlichem Vorbild nach, indem es einen Plan erstellt, der eine Abfolge von Schritten zur Erreichung eines Ziels enthält.

Mit CoT-basiertem Denken kann Agentforce Assistant mitgestalten und zusammenarbeiten. Damit war Agentforce Assistant im Vergleich zu herkömmlichen Bots recht fortschrittlich, aber er war nicht in der Lage, eine menschenähnliche Intelligenz wirklich nachzuahmen. Das System generierte einen Plan, der eine Abfolge von Aktionen als Reaktion auf Aufgaben enthielt, und führte diese Aktionen dann nacheinander aus. Wenn der Plan jedoch falsch war, gab es keine Möglichkeit, Benutzer:innen zu bitten, einzugreifen. Dies führte zu einer KI-Erfahrung, die nicht adaptiv war: Die Benutzer:innen konnten im Laufe eines Gesprächs keine neuen und nützlichen Informationen bereitstellen.

Als wir Agentforce Assistant strengen Tests mit Tausenden von Vertriebsmitarbeiter:innen aus unserer eigenen Vertriebsorganisation (Org 62) unterzogen haben, haben sich einige Muster herauskristallisiert:

  • Die Copilot-Konversationen in natürlicher Sprache waren viel besser als bei herkömmlichen Bots, aber sie erreichten noch nicht ganz das hohe Niveau menschlicher Konversationen. Die Gespräche mussten flüssiger und natürlicher werden.
  • Agentforce Assistant hat mit den konfigurierten Aktionen hervorragende Arbeit geleistet, um die Benutzerziele zu erfüllen, aber er war nicht in der Lage, Folgeanfragen zu Informationen zu verarbeiten, die bereits in der Konversation vorhanden waren. Um auf mehr Benutzeranfragen zu reagieren, musste der Kontext herangezogen werden.
  • Als wir weitere Aktionen hinzufügten, um mehr Anwendungsfälle zu automatisieren, verschlechterte sich die Leistung von Agentforce Assistant, sowohl in Bezug auf die Latenz (wie lange es dauerte, bis reagiert wurde) als auch in Bezug auf die Antwortqualität. Die Lösung musste effektiv auf Tausende von Anwendungsfällen und Anwendungen skaliert werden, die davon profitieren könnten.

Also machten wir uns daran, eine Lösung für diese Probleme zu finden. Das Ergebnis war Agentforce.

Agentblazer-Figuren

Werden Sie Agentblazer

Vernetzen Sie sich in unserer Community mit Agentblazern aus der ganzen Welt. Hier können Sie Ihre KI-Kompetenz erweitern, Anwendungsfälle entdecken, von Produktexpert:innen hören und vieles mehr. Fördern Sie Ihr KI-Know-how – und Ihre Karriere.

Agentforce: Ein großer Fortschritt im logischen Denken

Agentforce ist die branchenweit erste Lösung der Enterprise-Klasse zur Automatisierung von Konversationen, die in großem Umfang proaktive und intelligente Entscheidungen treffen kann. Menschliche Eingriffe sind dabei kaum oder gar nicht mehr nötig. Möglich wurde dies durch zahlreiche Weiterentwicklungen.

  • Orchestrierung basierend auf ReAct-Prompting im Vergleich zu CoT. Umfangreiche Experimente und Tests zeigten, dass Aufforderungen im Stil von Reasoning and Acting (ReAct) im Vergleich zur CoT-Technik viel bessere Ergebnisse lieferten. Im ReAct-Mechanismus durchläuft das System eine Schleife aus Argumentieren, Handeln und Beobachten, bis ein Benutzerziel erreicht ist. Diese Art von Looping-Ansatz ermöglicht es dem System, neue Informationen zu berücksichtigen und klärende Fragen oder Bestätigungen zu stellen, damit das Ziel des Benutzers so genau wie möglich erreicht wird. Dies führt auch zu einem viel flüssigeren und natürlichsprachlicheren Gesprächserlebnis.
  • Klassifizierung von Themen. Wir haben ein neues Konzept namens „Topics“ (Themen) eingeführt, das einer Benutzerabsicht oder einer zu erledigenden Aufgabe zugeordnet ist. Wenn eine Benutzereingabe eingeht, wird sie einem Thema zugeordnet, das die relevanten Anweisungen, Geschäftsrichtlinien und Aktionen zur Erfüllung dieser Anforderung enthält. Dieser Mechanismus hilft dabei, den Umfang der Aufgabe und den entsprechenden Lösungsraum für das LLM zu definieren, sodass das System mühelos skaliert werden kann. In Themen eingebettete Anweisungen in natürlicher Sprache bieten zusätzliche Anleitungen und Leitplanken für das LLM. Wenn wir also einige Aktionen benötigen, die in einer bestimmten Reihenfolge ausgeführt werden sollen, kann das eine Anweisung in natürlicher Sprache sein. Wenn es Geschäftsrichtlinien wie „kostenlose Rückgabe bis zu 30 Tagen“ gibt, können diese als Anweisung angegeben und an das LLM weitergegeben werden, damit es sie berücksichtigen und die Benutzerinteraktion entsprechend informieren kann. Diese Konzepte ermöglichen es Agenten, sicher und geschützt auf Tausende von Aktionen zu skalieren.
  • LLMs für Antworten verwenden. Zuvor haben wir das System so eingeschränkt, dass es nur mit Aktionsausgaben reagiert, was seine Fähigkeit, auf der Grundlage der in der Konversation verfügbaren Informationen zu reagieren, stark einschränkte. Indem wir das System so geöffnet haben, dass das LLM anhand des Kontexts im Konversationsverlauf antworten kann, haben wir ein weitaus umfassenderes Konversationserlebnis ermöglicht. Jetzt können Benutzer:innen um Klarstellungen bitten und Folgefragen zu früheren Ergebnissen stellen, was zu einer insgesamt höheren Zielerfüllungsrate führt.
  • Thoughts/Reasoning. LLMs dazu zu bringen, Gedanken auszutauschen oder Gründe für die Auswahl bestimmter Handlungen anzugeben, beugt Halluzinationen enorm vor. Dies hat den zusätzlichen Vorteil, dass es einen Einblick in das Verhalten des LLM bietet, sodass Administrator:innen und Entwickler:innen den Agenten fein abstimmen können, um ihn an ihre Bedürfnisse anzupassen. Die Begründung ist standardmäßig im Agent-Builder-Arbeitsbereich verfügbar, und Benutzer:innen können den Agenten auch mit Folgefragen auffordern, damit er seine Begründung erläutern kann. Dies beugt nicht nur Halluzinationen vor, sondern hilft auch, Vertrauen aufzubauen.

Zusätzliche Agentforce-Eigenschaften

Abgesehen von der Atlas Reasoning Engine hat Agentforce mehrere andere bemerkenswerte Eigenschaften, die das System von anderen abheben.

  • Proaktives Handeln. Benutzereingaben sind eine Möglichkeit, Agenten auszulösen. Agentforce Agenten können aber auch durch Datenoperationen im CRM oder durch Geschäftsprozesse und -regeln ausgelöst werden, wie z. B. eine Aktualisierung des Fallstatus, eine von einer Marke empfangene E-Mail oder ein Meeting, das in fünf Minuten beginnt. Diese Mechanismen verleihen den Agenten ein Maß an Eigeninitiative, das sie in verschiedenen dynamischen Geschäftsumgebungen nützlich und einsetzbar macht, und erweitern ihren Nutzen sowohl für das Front- als auch für das Backoffice.
  • Dynamischer Informationsabruf. Die meisten Anwendungsfälle in Unternehmen beinhalten das Abrufen von Informationen oder das Ergreifen von Maßnahmen. Einer der am weitesten verbreiteten Mechanismen, um Agenten mit statischen Informationen zu versorgen, ist die Erdung. Es ist jedoch die Fähigkeit der Agenten, dynamische Informationen zu nutzen, die ein enormes Potenzial an Anwendungsfällen und Anwendungen erschließt.

    Agentforce unterstützt mehrere Mechanismen, um dynamische Informationen zu nutzen. Die erste ist die Retrieval Augmented Generation (RAG). Durch die semantische Suche nach strukturierten und unstrukturierten Daten in Data Cloud über RAG können Agenten alle relevanten Informationen aus externen Datenquellen und Datenbanken abrufen.

    Zweitens haben wir mit der Einführung generischer Tools zum Abrufen von Informationen wie Websuche und Wissensfragen und -antworten die Fähigkeit des Agenten, komplexe Aufgaben zu bewältigen, verbessert. Stellen Sie sich vor, Sie recherchieren online über die Websuche nach einem Unternehmen oder einem Produkt, kombinieren dies mit internem Wissen über die Regeln und Richtlinien des Unternehmens und ergreifen dann eine Maßnahme in Form einer E-Mail-Zusammenfassung an einen Kontakt. Durch die Kombination von Daten aus mehreren Quellen kann der Agent Geschäftsaufgaben viel effektiver und effizienter erledigen.

    Schließlich können Agenten in Flows, APIs und Apex-Klassen bereitgestellt werden. Auf diese Weise können alle Kontextinformationen in einem Workflow sowie Informationen für verschiedene Szenarien an den Agents übergeben werden, sodass keine benutzerdefinierten Lösungen erstellt und jedes Szenario separat behandelt werden müssen. All diese Mechanismen, die es den Agenten ermöglichen, dynamische Informationen anzuzapfen, ermöglichen es ihnen, ihre Umgebung besser zu verstehen, was ihre Interaktivität um ein Vielfaches erhöht.
  • Übertragung an menschlichen Agenten. KI ist nichtdeterministisch und kann halluzinieren. Aus diesem Grund haben wir Pionierarbeit bei der robusten Einstein Trust Layer entwickelt. Wir haben Regeln in unsere Systemaufforderungen eingebaut, um zu verhindern, dass LLMs abschweifen und halluzinieren. Aber trotz all dieser Mechanismen sind LLMs immer noch nicht 100 % genau. Für kritische Geschäftsszenarien, in denen die Fehlertoleranz Null ist, ist die nahtlose Übergabe an einen Menschen von entscheidender Bedeutung, die Agentforce nativ unterstützt. Agentforce behandelt die „Übergabe an den menschlichen Agenten“ als eine weitere Aktion, die es ermöglicht, eine Konversation in jedem gewünschten Geschäftsszenario sicher und nahtlos auf Menschen zu übertragen.

Wie geht es weiter bei Agentforce

Kunden wie Wiley und Saks Fifth Avenue sehen mit dem Agentforce Service Agent einen exponentiellen Einfluss auf ihre Geschäfts-KPIs. Da sich das Rad der Innovation und des technologischen Fortschritts bei Salesforce Research und in der Branche weiterhin rasant dreht, arbeiten wir weiterhin mit Höchstgeschwindigkeit daran, verschiedene Innovationen zu nutzen, um Agenten noch robuster und intelligenter zu machen. Zu den Fortschritten, die Kund:innen in naher Zukunft erwarten können, gehören:

  • Ein Test- und Evaluierungsframework für Agenten. Ein komplexes agentisches System wie Agentforce in Unternehmen einzuführen, erfordert eine Menge an Tests und Validierungen. Aus diesem Grund haben wir einen robusten Bewertungsrahmen entwickelt, um die Aktionsergebnisse, Eingaben, Ausgaben, die Planungsgenauigkeit, die Themenklassifizierung und den Status zu testen. Wir haben dieses Framework verwendet, um die Agenten anhand von Metriken wie Genauigkeit, Latenz, Servicekosten und Vertrauen zu optimieren. Im Gegensatz zu den meisten allgemein verfügbaren Frameworks und Benchmarks, die sich in erster Linie auf die Bewertung der Leistung eines LLM bei Aufgaben wie Mathematik, Naturwissenschaften und Allgemeinwissen konzentrieren, ist unser Bewertungsframework speziell auf Anwendungsfälle in CRM-Unternehmen ausgerichtet. Außerdem haben wir den weltweit ersten LLM-BenchmarkWird in neuem Fenster geöffnet veröffentlicht und arbeiten derzeit daran, unser Bewertungsframework für Agenten Kund:innen und Partner:innen zur Verfügung zu stellen.
  • Multi-Intent-Unterstützung. Dies ist ein wichtiger Eckpfeiler für die Replikation eines menschenähnlichen Konversationsmechanismus. Nicht wenige alltägliche Ausdrücke bestehen aus mehreren, unabhängigen Zielen, wie z. B. „Meine Bestellung aktualisieren und mir ein Hemd in Größe M finden“, „Aktualisiere den Fallstatus und sende dem Kunden eine Zusammenfassung der Schritte zur Fehlerbehebung per E-Mail“ und „Buche einen Flug und reserviere ein Hotel“. Mit der Kombination aus den Funktionen des Verständnisses natürlicher Sprache von LLMs, der Unterstützung großer Kontextfenster und unseren innovativen Konzepten wie Themen experimentieren wir weiter, um eine zuverlässige, skalierbare und sichere Lösung für unsere Kunden zu schaffen.
  • Multimodale Unterstützung. Die meisten digitalen Interaktionen sind textbasiert, doch sprach- und bildbasierte Interaktionen bieten deutlich bessere Erfahrungen, da sie die natürlichste Art der menschlichen Interaktion darstellen. Dank Fortschritten wie der gleichzeitigen Verarbeitung multimodaler Eingaben, schnelleren Reaktionszeiten, großen Kontextfenstern und komplexen Reasoning-Funktionen wird der Markt für multimodale KI bis 2031 voraussichtlich um etwa 36 %Wird in neuem Fenster geöffnet wachsen. Für die multimodale Unterstützung gibt es zahlreiche Anwendungsfälle, von denen Unternehmen sofort profitieren können:
    • Anwendungsfälle für sprachbasierte Interaktionen. Interactive Voice Response (IVR) kann durch Sprachunterstützung, Mitarbeitercoaching, Schulungen und Onboarding basierend auf generativer KI ersetzt werden.
    • Anwendungsfälle für bildbasierte Interaktionen. Produktsuche und -vergleich, Durchsuchen der Benutzeroberfläche (Web, Mobile), Fehlerbehebung und Problemlösung für den Außendienst.
  • Unterstützung mehrerer Agenten. Agent-to-Agent-Interaktionen stellen eine der transformativsten Geschäftsentwicklungen unserer Zeit dar. Aufgrund ihrer Fähigkeit, Informationen gleichzeitig abzurufen, zusammenzustellen und zu verarbeiten, können Multi-Agent-Systeme die Verarbeitungszeiten für lange, komplexe Arbeitsabläufe, die derzeit aufgrund der Übergabe von Mensch zu Mensch nacheinander ablaufen, exponentiell verkürzen. Digitale Agenten können in diese Arbeitsabläufe eingefügt werden, um wiederholbare Datenverarbeitungsaufgaben zu erledigen, und sie können auch den an diesen Prozessen beteiligten Menschen helfen, effizienter zu sein.

    Wir führen bereits diese Art von Multi-Agent-Paradigma in den Vertriebsprozess ein, bei dem ein Agent als Vertriebsentwicklungsmitarbeiter fungieren kann, um die Pipeline zu pflegen, oder als Verkaufscoach, um eine:n Vertriebsmitarbeiter:in zu beraten, wie er:sie am besten einen Deal verhandelt. Spezialisierte Agenten können auch andere Aspekte des Verkaufsprozesses wie Lead-Qualifizierung, Angebotserstellung und Nachverfolgung nach dem Verkauf übernehmen. In gleicher Weise kann ein Service-Workflow aus Agentsbestehen, die Tickets beheben, nachverfolgen und zuweisen, sowie aus Agenten, die auf Kundenanfragen antworten und menschliche Mitarbeiter:innen unterstützen.

Machen Sie sich bereit für die dritte Welle der KI

Agentforce stellt die dritte Welle der KI dar, nach Predictive AI und Copiloten. Mit Agentforce können Kund:innen Agenten erstellen, die nicht nur auf Gesprächsaufforderungen reagieren, um Maßnahmen zu ergreifen, sondern auch mit minimaler Hilfe zu antizipieren, zu planen und zu argumentieren. Agenten können ganze Arbeitsabläufe oder Prozesse automatisieren, Entscheidungen treffen und sich an neue Informationen anpassen, und das alles ohne menschliches Eingreifen. Gleichzeitig können diese Agenten eine nahtlose Übergabe an die menschlichen Mitarbeiter:innen gewährleisten und so die Zusammenarbeit in allen Geschäftsbereichen erleichtern. Diese Agenten, die auf der Atlas Reasoning Engine basieren, können mit nur wenigen Klicks eingesetzt werden, um jede Geschäftsfunktion oder jedes Team zu erweitern und zu transformieren.