Servicekonsole mit einem Chat-Fenster, in dem Einstein bei der Beantwortung von Fragen hilft

Wie die Atlas Reasoning Engine Agentforce antreibt

Autonome, proaktive KI-Agents sind das Herzstück der Agentforce. Aber wie funktionieren sie? Werfen wir einen Blick unter die Haube.

Shipra Gupta

Die Innovationsgeschwindigkeit in der Welt der KI – und insbesondere der generativen KI – schreitet in rasantem Tempo voran. Mit der ausgeklügelten Technologie, die jetzt verfügbar ist, entwickelt sich die Branche rasant von der assistiven Konversationsautomatisierung zur rollenbasierten Automatisierung, die die Belegschaft erweitert. Damit künstliche Intelligenz (KI) eine Leistung auf menschlichem Niveau nachahmen kann, ist es wichtig zu verstehen, was Menschen bei der Erledigung von Aufgaben am effektivsten macht: Handlungsfähigkeit. Menschen können Daten aufnehmen, über mögliche Wege nachdenken und Maßnahmen ergreifen. Die Ausstattung von KI mit einer solchen Handlungsfähigkeit erfordert ein extrem hohes Maß an Intelligenz und Entscheidungsfindung.

Bei Salesforce habt die neuesten Fortschritte bei Large Language Models (LLMs) und Denktechniken genutzt, um Agentforce auf den Markt zu bringen. Agentforce handelt es sich um eine Suite von sofort einsatzbereiten KI-Agents – autonome, proaktive Anwendungen, die für die Ausführung spezieller Aufgaben entwickelt wurden – und eine Reihe von Tools, um sie zu erstellen und anzupassen. Diese autonomen KI-Agents können auf einem hohen Niveau der Raffinesse denken, argumentieren, planen und orchestrieren. Agentforce stellt einen Quantensprung in der KI-Automatisierung für Kundenservice, Vertrieb, Marketing, Handel und mehr dar.

Dieser Artikel beleuchtet die Innovationen, die in der Atlas Reasoning Engine gipfelten – dem Gehirn von Agentforce, das bei Salesforce AI ResearchWird in neuem Fenster geöffnet entwickelt wurde – und das Aktionen intelligent und autonom orchestriert, um Unternehmen eine agentische Lösung der Enterprise-Klasse zu bieten.

Berechnen Sie Ihren ROI für Agentforce.

Finden Sie heraus, wie viel Zeit und Geld Sie mit einem Team von KI-gestützten Agenten sparen können, die Seite an Seite mit Ihren Mitarbeiter:innen arbeiten. Beantworten Sie einfach vier schnelle Fragen und erfahren Sie, was mit Agentforce möglich ist.

Die Entwicklung von Einstein Copilot zu Agentforce

Anfang des Jahres haben wir Einstein Copilot herausgebracht. Das System hat sich mittlerweile zu einem Agentforce-Agent für Customer Relationship Management (CRM) entwickelt. Einstein Copilot war ein auf generative KI-gestützter Konversationsassistent, der seine Intelligenz aus einem Mechanismus namens Chain-of-Thought ReasoningWird in neuem Fenster geöffnet (CoT) ableitete. In diesem Mechanismus ahmt das KI-System die Entscheidungsfindung nach menschlichem Vorbild nach, indem es einen Plan erstellt, der eine Abfolge von Schritten zur Erreichung eines Ziels enthält.

Mit CoT-basiertem Denken könnten Einstein Copilot im Fluss der Arbeit mitgestalten und zusammenarbeiten. Damit war es im Vergleich zu herkömmlichen Bots recht fortschrittlich, aber es war nicht in der Lage, eine menschenähnliche Intelligenz wirklich nachzuahmen. Das System generierte einen Plan, der eine Abfolge von Aktionen als Reaktion auf Aufgaben enthielt, und führte diese Aktionen dann nacheinander aus. Wenn der Plan jedoch falsch war, gab es keine Möglichkeit, Benutzer:innen zu bitten, einzugreifen. Dies führte zu einer KI-Erfahrung, die nicht adaptiv war: Die Benutzer:innen konnten im Laufe eines Gesprächs keine neuen und nützlichen Informationen bereitstellen.

Als wir Einstein Copilot strengen Tests mit Tausenden von Vertriebsmitarbeiter:innen aus unserer eigenen Vertriebsorganisation (Org 62) unterzogen haben, haben sich einige Muster herauskristallisiert:

  • Die natürlichsprachliche Konversationserfahrung von Copilot war wie erwartet viel besser als bei herkömmlichen Bots, aber sie erreichte noch nicht den heiligen Gral, wirklich menschenähnlich zu sein. Es musste gesprächiger sein.
  • Copilot hat mit den konfigurierten Aktionen hervorragende Arbeit geleistet, um die Benutzerziele zu erfüllen, aber es war nicht in der Lage, Folgeanfragen zu Informationen zu verarbeiten, die bereits in der Konversation vorhanden waren. Um auf mehr Benutzeranfragen zu reagieren, musste der Kontext herangezogen werden.
  • Als wir weitere Aktionen hinzufügten, um mehr Anwendungsfälle zu automatisieren, verschlechterte sich die Leistung von Copilot, sowohl in Bezug auf die Latenz (wie lange es dauerte, bis reagiert wurde) als auch in Bezug auf die Antwortqualität. Die Lösung musste effektiv auf Tausende von Anwendungsfällen und Anwendungen skaliert werden, die davon profitieren könnten.

Wir machten uns daran, eine Lösung für diese Probleme zu finden, und das führte zur Geburt von Agentforce.

Agentblazer-Figuren

Werden Sie Agentblazer

Vernetzen Sie sich in unserer Community mit Agentblazern aus der ganzen Welt. Hier können Sie Ihre KI-Kompetenz erweitern, Anwendungsfälle entdecken, von Produktexpert:innen hören und vieles mehr. Fördern Sie Ihr KI-Know-how – und Ihre Karriere.

Agentforce: ein großer Sprung in der Argumentation

Agentforce ist die branchenweit erste Konversationsautomatisierungslösung der Enterprise-Klasse, die proaktive und intelligente Entscheidungen in großem Umfang mit wenig oder gar keinem menschlichen Eingreifen treffen kann. Mehrere Weiterentwicklungen machen dies möglich.

  • Orchestrierung basierend auf ReAct-Prompting im Vergleich zu CoT. Umfangreiche Experimente und Tests zeigten, dass Aufforderungen im Stil von Reasoning and Acting (ReAct) im Vergleich zur CoT-Technik viel bessere Ergebnisse lieferten. Im ReAct-Mechanismus durchläuft das System eine Schleife aus Argumentieren, Handeln und Beobachten, bis ein Benutzerziel erreicht ist. Diese Art von Looping-Ansatz ermöglicht es dem System, neue Informationen zu berücksichtigen und klärende Fragen oder Bestätigungen zu stellen, damit das Ziel des Benutzers so genau wie möglich erreicht wird. Dies führt auch zu einem viel flüssigeren und natürlichsprachlicheren Gesprächserlebnis.
  • Klassifizierung von Themen. Wir haben ein neues Konzept namens „Topics“ (Themen) eingeführt, das einer Benutzerabsicht oder einer zu erledigenden Aufgabe zugeordnet ist. Wenn eine Benutzereingabe eingeht, wird sie einem Thema zugeordnet, das die relevanten Anweisungen, Geschäftsrichtlinien und Aktionen zur Erfüllung dieser Anforderung enthält. Dieser Mechanismus hilft dabei, den Umfang der Aufgabe und den entsprechenden Lösungsraum für das LLM zu definieren, sodass das System mühelos skaliert werden kann. In Themen eingebettete Anweisungen in natürlicher Sprache bieten zusätzliche Anleitungen und Leitplanken für das LLM. Wenn wir also einige Aktionen benötigen, die in einer bestimmten Reihenfolge ausgeführt werden sollen, kann das eine Anweisung in natürlicher Sprache sein. Wenn es Geschäftsrichtlinien wie „kostenlose Rückgabe bis zu 30 Tagen“ gibt, können diese als Anweisung angegeben und an das LLM weitergegeben werden, damit es sie berücksichtigen und die Benutzerinteraktion entsprechend informieren kann. Diese Konzepte ermöglichen es Agents, sicher und geschützt auf Tausende von Aktionen zu skalieren.
  • LLMs für Antworten verwenden. Zuvor haben wir das System so eingeschränkt, dass es nur mit Aktionsausgaben reagiert, was seine Fähigkeit, auf der Grundlage der in der Konversation verfügbaren Informationen zu reagieren, stark einschränkte. Indem wir das System so geöffnet haben, dass das LLM anhand des Kontexts im Konversationsverlauf antworten kann, haben wir ein weitaus reichhaltigeres Konversationserlebnis ermöglicht. Jetzt können Benutzer um Klarstellungen bitten und Folgefragen zu früheren Ergebnissen stellen, was zu einer insgesamt höheren Zielerfüllungsrate führt.
  • Thoughts/Reasoning. LLMs dazu zu bringen, Gedanken auszutauschen oder Gründe für die Auswahl bestimmter Handlungen anzugeben, beugt Halluzinationen enorm vor. Dies hat den zusätzlichen Vorteil, dass es einen Einblick in das Verhalten des LLM bietet, sodass Administrator:innen und Entwickler:innen den Agents fein abstimmen können, um ihn an ihre Bedürfnisse anzupassen. Die Begründung ist standardmäßig im Agent Builder-Arbeitsbereich verfügbar, und Benutzer:innen können den Agent auch mit Folgefragen auffordern, damit er seine Begründung erläutern kann. Dies beugt nicht nur Halluzinationen vor, sondern hilft auch, Vertrauen aufzubauen.

Zusätzliche Agentforce-Eigenschaften

Abgesehen von der Atlas Reasoning Engine hat Agentforce mehrere andere bemerkenswerte Eigenschaften, die das System von anderen abheben.

  • Proaktives Handeln. Benutzereingaben sind eine Möglichkeit, Agents auszulösen. Agentforce Agents können aber auch durch Datenoperationen im CRM oder durch Geschäftsprozesse und -regeln ausgelöst werden, wie z. B. eine Aktualisierung des Fallstatus, eine von einer Marke empfangene E-Mail oder ein Meeting, das in fünf Minuten beginnt. Diese Mechanismen verleihen den Agents ein Maß an Eigeninitiative, das sie in verschiedenen dynamischen Geschäftsumgebungen nützlich und einsetzbar macht, und erweitern ihren Nutzen sowohl für das Front- als auch für das Backoffice.
  • Dynamischer Informationsabruf. Die meisten Anwendungsfälle in Unternehmen beinhalten das Abrufen von Informationen oder das Ergreifen von Maßnahmen. Einer der am weitesten verbreiteten Mechanismen, um Agents mit statischen Informationen zu versorgen, ist die Erdung. Es ist jedoch die Fähigkeit der Agents, dynamische Informationen zu nutzen, die ein enormes Potenzial an Anwendungsfällen und Anwendungen erschließt.

    Agentforce unterstützt mehrere Mechanismen, um dynamische Informationen zu nutzen. Die erste ist die Retrieval Augmented Generation (RAG). Durch die semantische Suche nach strukturierten und unstrukturierten Daten in Data Cloud über RAG können Agents alle relevanten Informationen aus externen Datenquellen und Datenbanken abrufen.

    Zweitens haben wir mit der Einführung generischer Tools zum Abrufen von Informationen wie Websuche und Wissensfragen und -antworten die Fähigkeit des Agents, komplexe Aufgaben zu bewältigen, verbessert. Stellen Sie sich vor, Sie recherchieren online über die Websuche nach einem Unternehmen oder einem Produkt, kombinieren dies mit internem Wissen über die Regeln und Richtlinien des Unternehmens und ergreifen dann eine Maßnahme in Form einer E-Mail-Zusammenfassung an einen Kontakt. Durch die Kombination von Daten aus mehreren Quellen kann der Agent Geschäftsaufgaben viel effektiver und effizienter erledigen.

    Schließlich können Agents in Flows, APIs und Apex-Klassen bereitgestellt werden. Auf diese Weise können alle Kontextinformationen in einem Workflow sowie Informationen für verschiedene Szenarien an den Agents übergeben werden, sodass keine benutzerdefinierten Lösungen erstellt und jedes Szenario separat behandelt werden müssen. All diese Mechanismen, die es den Agents ermöglichen, dynamische Informationen anzuzapfen, ermöglichen es ihnen, ihre Umgebung besser zu verstehen, was ihre Interaktivität um ein Vielfaches erhöht.
  • Übertragung an menschlichen Agents. KI ist nichtdeterministisch und kann halluzinieren. Aus diesem Grund haben wir Pionierarbeit bei der robusten Einstein Trust Layer entwickelt, um Toxizitätserkennung, Verträge ohne Vorratsdatenspeicherung, Sofortinjektionsschutz und verschiedene andere Mechanismen bereitzustellen. Wir haben Regeln in unsere Systemaufforderungen eingebaut, um zu verhindern, dass LLMs abschweifen und halluzinieren. Aber trotz all dieser Mechanismen sind LLMs immer noch nicht 100 % genau. Für kritische Geschäftsszenarien, in denen die Fehlertoleranz Null ist, ist die nahtlose Übergabe an einen Menschen von entscheidender Bedeutung, die Agentforce nativ unterstützt. Agentforce behandelt die „Übergabe an den menschlichen Agent“ als eine weitere Aktion, die es ermöglicht, eine Konversation in jedem gewünschten Geschäftsszenario sicher und nahtlos auf Menschen zu übertragen.

Wie geht es weiter für Agentforce

Obwohl Agentforce noch in den Kinderschuhen steckt, ist es für unsere Kund:innen ein entscheidender Faktor. Kunden wie Wiley und Saks Fifth Avenue sehen mit dem Agentforce Service Agent einen exponentiellen Einfluss auf ihre Geschäfts-KPIs. Da sich das Rad der Innovation und des technologischen Fortschritts bei Salesforce Research und in der Branche weiterhin rasant dreht, arbeiten wir weiterhin mit Höchstgeschwindigkeit daran, verschiedene Innovationen zu nutzen, um Agents noch robuster und intelligenter zu machen. Zu den Fortschritten, die Kund:innen in naher Zukunft erwarten können, gehören:

  • Ein Test- und Evaluierungsframework für Agents. Ein komplexes agentisches System wie Agentforce in Unternehmen einzuführen, erfordert eine Herkulesmenge an Tests und Validierungen. Aus diesem Grund haben wir einen robusten Bewertungsrahmen entwickelt, um die Aktionsergebnisse, Eingaben, Ausgaben, die Planungsgenauigkeit, die Themenklassifizierung und den Planerstatus zu testen. Wir haben dieses Framework verwendet, um die Agents anhand von Metriken wie Genauigkeit, Latenz, Servicekosten und Vertrauen zu optimieren. Im Gegensatz zu den meisten allgemein verfügbaren Frameworks und Benchmarks, die sich in erster Linie auf die Bewertung der Leistung eines LLM bei Aufgaben wie Mathematik, Naturwissenschaften und Allgemeinwissen konzentrieren, ist unser Bewertungsframework speziell auf Anwendungsfälle in CRM-Unternehmen ausgerichtet. Außerdem haben wir den weltweit ersten LLM-BenchmarkWird in neuem Fenster geöffnet veröffentlicht und arbeiten derzeit daran, unser Bewertungsframework für Agents Kund:innen und Partner:innen zur Verfügung zu stellen.
  • Multi-Intent-Unterstützung. Dies ist ein wichtiger Eckpfeiler für die Replikation eines menschenähnlichen Konversationsmechanismus. Nicht wenige alltägliche Ausdrücke bestehen aus mehreren, unabhängigen Zielen, wie z. B. „Meine Bestellung aktualisieren und mir ein Hemd in Größe M finden“, „Aktualisiere den Fallstatus und sende dem Kunden eine Zusammenfassung der Schritte zur Fehlerbehebung per E-Mail“ und „Buche einen Flug und reserviere ein Hotel“. Mit der Kombination aus den Funktionen des Verständnisses natürlicher Sprache von LLMs, der Unterstützung großer Kontextfenster und unseren innovativen Konzepten wie Themen experimentieren wir weiter, um eine zuverlässige, skalierbare und sichere Lösung für unsere Kunden zu schaffen.
  • Multimodale Unterstützung. Während die meisten digitalen Interaktionen textbasiert sind, erhöhen sprach- und bildbasierte Interaktionen den Reichtum der Erfahrungen um ein Vielfaches, da sie die natürlichste Art der menschlichen Interaktion darstellen. Mit Fortschritten wie der gleichzeitigen Verarbeitung multimodaler Eingaben, schnelleren Reaktionszeiten, großen Kontextfenstern und ausgefeilten Denkfunktionen wird der Markt für multimodale KI bis 2031 voraussichtlich um etwa 36 %Wird in neuem Fenster geöffnet wachsen. Es gibt mehrere Anwendungsfälle in Unternehmen, die sofort von der multimodalen Unterstützung profitieren können:
    • Anwendungsfälle für Voice. Ersetzen Sie Interactive Voice Response (IVR) durch generative KI-gestützte Sprachunterstützung, Mitarbeitercoaching, Schulung und Onboarding.
    • Anwendungsfälle für die Bildverarbeitung. Produktsuche und -vergleich, Durchsuchen der Benutzeroberfläche (Web, Mobil), Fehlerbehebung und Problemlösung für den Außendienst.
  • Unterstützung mehrerer Agents. Agent-to-Agent-Interaktionen stellen eine der transformativsten Geschäftsentwicklungen unserer Zeit dar. Aufgrund ihrer Fähigkeit, Informationen gleichzeitig abzurufen, zusammenzustellen und zu verarbeiten, können Multi-Agent-Systeme die Verarbeitungszeiten für lange, komplexe Arbeitsabläufe, die derzeit aufgrund der Übergabe von Mensch zu Mensch nacheinander ablaufen, exponentiell verkürzen. Digitale Agents können in diese Arbeitsabläufe eingefügt werden, um wiederholbare Datenverarbeitungsaufgaben zu erledigen, und sie können auch den an diesen Prozessen beteiligten Menschen helfen, effizienter zu sein.

    Wir führen bereits diese Art von Multi-Agent-Paradigma in den Vertriebsprozess ein, bei dem ein Agent als Vertriebsentwicklungsmitarbeiter fungieren kann, um die Pipeline zu pflegen, oder als Verkaufscoach, um eine:n Vertriebsmitarbeiter:in zu beraten, wie er:sie am besten einen Deal verhandelt. Spezialisierte Agents können auch andere Aspekte des Verkaufsprozesses wie Lead-Qualifizierung, Angebotserstellung und Nachverfolgung nach dem Verkauf übernehmen. In gleicher Weise kann ein Service-Workflow aus Agentsbestehen, die Tickets beheben, nachverfolgen und zuweisen, sowie aus Agents, die auf Kundenanfragen antworten und menschliche Mitarbeiter unterstützen.

Machen Sie sich bereit für die dritte Welle der KI

Agentforce stellt die dritte Welle der KI dar, nach Predictive AI und Copiloten. Mit Agentforce können Kund:innen Agents erstellen, die nicht nur auf Gesprächsaufforderungen reagieren, um Maßnahmen zu ergreifen, sondern auch mit minimaler Hilfe zu antizipieren, zu planen und zu argumentieren. Agents können ganze Arbeitsabläufe oder Prozesse automatisieren, Entscheidungen treffen und sich an neue Informationen anpassen, und das alles ohne menschliches Eingreifen. Gleichzeitig können diese Agents eine nahtlose Übergabe an die menschlichen Mitarbeiter:innen gewährleisten und so die Zusammenarbeit in allen Geschäftsbereichen erleichtern. Diese Agents, die auf der Atlas Reasoning Engine basieren, können mit nur wenigen Klicks eingesetzt werden, um jede Geschäftsfunktion oder jedes Team zu erweitern und zu transformieren.