AgentforceGuía para lograr un comportamiento fiable de los agentes

Marco de 5 niveles de determinismo

Olfa Kharrat, directora de Gestión de Productos - Agentforce
Reinier van Leuken, directora sénior de Gestión de Productos - Agentforce

Índice

Agentes frente a chatbots

Componentes básicos y razonamiento agéntico de Agentforce

Definición de niveles de control agéntico

Control agéntico de nivel uno: razonamiento con selección de acciones de solicitud y tema sin instrucciones previas

Control agéntico de nivel dos: instrucciones

Control agéntico de nivel tres: Fundamentación

Control agéntico de nivel cuatro: variables

Control agéntico de nivel cinco: acciones deterministas

Resumen de los métodos para lograr el determinismo guiado

Introducción

La confianza ha sido el valor central en Salesforce desde su fundación en 1999, como pionera en un nuevo modelo tecnológico de computación en la nube y SaaS. Las empresas depositan su confianza en Salesforce al almacenar datos valiosos en la nube, ya que tienen la tranquilidad de que sus datos están protegidos y se rigen por los controles de acceso adecuados. La confianza sigue siendo un aspecto esencial, pero en la era de la IA agéntica, la definición de este término es aún más amplia. Dado que las empresas dependen cada vez más de agentes autónomos para llevar a cabo funciones críticas, estos deben convertirse en socios comerciales de confianza cuyo trabajo sea preciso, relevante y, sobre todo, fiable.

Dicho esto, ¿cómo se crea un agente fiable? La fiabilidad suele traducirse en ofrecer el mismo resultado para una misma entrada. Sin embargo, los agentes no funcionan necesariamente así, ya que se basan en modelos de lenguaje grandes (LLM), cuya naturaleza es no determinista. Eso da a los agentes la fluidez necesaria para desarrollar soluciones creativas adaptadas a circunstancias específicas, sin necesidad de tener que programar explícitamente cada condición o situación que encuentren. Sin embargo, los agentes también necesitan control para cumplir con los requisitos empresariales y las directrices operativas. Cuando ejecuten procesos de negocio, deben ser fiables y generar resultados empresariales que se ajusten a restricciones deterministas. El determinismo impone una rigidez y una disciplina que chocan con la autonomía y la fluidez que proporcionan los agentes. Por ello, la clave para crear agentes fiables es encontrar el equilibrio adecuado entre la fluidez creativa y el control empresarial.

En este documento, abordaremos los aspectos clave que hay que tener en cuenta para desarrollar agentes fiables. Se definen cinco niveles de control agéntico y se incluyen prácticas recomendadas para obtener el control del comportamiento agéntico y mantenerlo en cada uno de estos niveles. Además, se explican las formas en que funciona el Agentforce motor de razonamiento. A medida que se amplíe Agentforce, este documento se actualizará para reflejar las últimas prácticas recomendadas.

Este documento presupone que el lector está familiarizado con los aspectos básicos del diseño y la creación de agentes de Agentforce. Para una introducción a Agentforce, recomendamos lo siguiente:

Revisar los recursos en agentforce.com.
Seguir la ruta Conviértase en un campeón Agentblazer . Esta ruta aborda conceptos básicos de IA y le ayuda a desarrollar un agente básico para tareas clave.
Obtenga más información sobre Agentforce en help.salesforce.com , y específicamente sobre diseñar e implementar agentes . Esta ruta de aprendizaje le guía a través de todos los pasos clave del ciclo de vida del agente, desde la ideación de su solución y la configuración, hasta las pruebas, la implementación y la supervisión.

Agentes frente a chatbots

Para comprender mejor el comportamiento de los agentes, resulta útil compararlos con sus homólogos rígidos: los chatbots.

Chatbots: seguidores de reglas rígidos

Los chatbots siguen árboles de decisión predeterminados que estructuran los diálogos en los que pueden participar. El recorrido a través de estos árboles de decisión se basa en la respuesta dada por el usuario. Esta respuesta puede ser una selección de un conjunto predeterminado de opciones, o puede ser una respuesta de texto libre. En caso de una respuesta de texto libre, se utiliza un modelo predictivo para clasificar la intención. Estos árboles trazan todas las posibles rutas de conversación y dictan las respuestas del chatbot en cada paso. El comportamiento del chatbot está rígidamente determinado por reglas preestablecidas. Si la entrada del usuario no coincide con una ruta reconocida, o si el modelo predictivo no ha sido entrenado para reconocer una determinada intención, el chatbot no responde adecuadamente.

Agentes: adaptativos e intuitivos

Por el contrario, los agentes aprovechan el poder de los LLM y sus capacidades avanzadas de procesamiento de lenguaje natural (NLP). Los LLM permiten a los agentes comprender la intención que hay detrás de la entrada de un usuario, incluso si está redactada de una forma no prevista. En función de cómo haya entendido la intención, el agente selecciona la acción más adecuada entre una gama de posibilidades. El agente puede incluso formular respuestas completamente nuevas. Esta flexibilidad y adaptabilidad diferencian a los agentes de sus homólogos, los chatbots.

Analogía culinaria

La diferencia entre chatbots y agentes se puede comparar con el contraste entre un cocinero novato y un chef experimentado.

El cocinero principiante (chatbot) suele basarse en una receta detallada, con medidas precisas, instrucciones paso a paso y tiempos de cocción específicos. Cualquier cambio en la receta acaba en desastre. De igual modo, el chatbot debe funcionar dentro de los límites de su árbol de decisiones preprogramado.
El chef experimentado (agente) posee años de experiencia culinaria y con su intuición. Con una idea general de las preferencias del cliente y una breve descripción de los ingredientes disponibles, el chef es capaz de preparar una comida deliciosa que se adapte a las necesidades de cada comensal. Los pasos exactos pueden variar cada vez, y cada versión del plato puede tener diferencias sutiles, pero el resultado general siempre es satisfactorio. Del mismo modo, el agente puede adaptar su enfoque en función del contexto y la intención de la entrada del usuario, lo que da como resultado una interacción satisfactoria.

En resumen, la diferencia fundamental entre los agentes y los chatbots radica en su adaptabilidad y capacidad para gestionar entradas inesperadas.

Componentes básicos y razonamiento agéntico de Agentforce

Una característica distintiva de la inteligencia de un agente reside en su capacidad para organizar y desencadenar las acciones más adecuadas en el momento oportuno. Esta flexibilidad elimina la necesidad de programar exhaustivamente cada posible interacción del usuario.

Componentes básicos

En Agentforce, la creación de un agente incluye temas, acciones e instrucciones y descripciones en lenguaje natural.

Temas

Los temas son las "tareas por hacer" del agente. Los temas tienen atributos como la descripción de una clasificación, el alcance o las instrucciones que definen cada tarea y cómo se realiza. Los temas contienen acciones que el agente puede ejecutar, junto con instrucciones que determinan cómo se ejecutan estas acciones.

Acciones

Las acciones son las tareas predefinidas que el agente puede realizar para hacer su trabajo. Hay cinco tipos diferentes de acciones:

Ejecutar código Apex
Llamar a una API
Ejecutar un flujo
Obtener una respuesta del LLM a una plantilla de solicitud
Llamar a un modelo predictivo

Instrucciones y descripciones en lenguaje natural

La definición de un agente contiene instrucciones en lenguaje natural que describen los activos del agente y definen las pautas dentro de las cuales debe operar. Las instrucciones se escriben para acciones y temas.

Acciones. Una acción contiene:
- Instrucciones que describen lo que hace la acción, lo que indica al motor de razonamiento cuándo ejecutarla.
- Entradas con una descripción en lenguaje natural para que el agente pueda prepararlas.
- Resultados con una descripción en lenguaje natural de cómo darles formato y utilizarlos.
Tema. Un tema contiene instrucciones que determinan cómo ejecutar sus acciones en un nivel superior. Por ejemplo, las instrucciones pueden especificar salvaguardas sobre el tono de voz, la secuencia de acciones deseada, los posibles requisitos previos o cuándo derivar las conversaciones a humanos. El tema también contiene una descripción de la clasificación y una delimitación del ámbito. En conjunto, esto garantiza que el agente se mantenga dentro del ámbito de su función definida y realice el trabajo.
Datos. Los agentes necesitan datos para poder hacer bien su trabajo. Los datos pueden ser estructurados, como los datos de CRM, o no, como los artículos de conocimiento de la empresa. Los agentes acceden a los datos mediante entradas de acción. Por ejemplo, una acción puede llamar a una plantilla de solicitud basada en datos de CRM o completada con fragmentos de datos no estructurados mediante técnicas de RAG.

Estos componentes, cuando se crean correctamente, ayudan al agente a cumplir su finalidad prevista mientras opera dentro de los límites establecidos.

Gráfico de diagrama de flujo que muestra los componentes básicos de Agentforce.

Motor de razonamiento

El motor de razonamiento de Agentforce organiza estos componentes básicos para conseguir un comportamiento agéntico adecuado. Utiliza las instrucciones y descripciones en lenguaje natural definidas en temas y acciones. Se basa en React, un nuevo paradigma de razonamiento para los LLM introducido en 2022 por Yao et al. Este paradigma imita la gestión humana de tareas cuando razona sobre un problema, toma medidas, observa los resultados de las medidas y repite el ciclo hasta completar la tarea.

Los agentes de Salesforce se adhieren a este paradigma:

Razonamiento: entender la intención del usuario y alinearla con el tema y la acción correctos.
Acción: lanzar la cadena de acciones correcta.
Observación: evaluar los resultados de la acción en función de la intención del usuario. Si la intención no se cumple, razona más en función del resultado obtenido hasta el momento, y en las instrucciones y descripciones del tema/acción. Si se cumple, proporciona la respuesta final respetando las posibles instrucciones de formato.
Repetición: iterar estos pasos hasta que se alcanza el paso final indicado.

El motor de razonamiento recurre al LLM en cada paso de razonamiento y observación. Dependiendo del tipo de acción, también puede usar el LLM en el paso de acción.

Definición de niveles de control agéntico

En esta sección se describe un enfoque por capas para mejorar el determinismo de los agentes. Cada nivel se desarrolla a partir del anterior, con una complejidad y capacidades crecientes que establecen un mayor control sobre el comportamiento del agente.

Gráfico que muestra los niveles de control para un mejorar el comportamiento del agente.

1. Razonamiento con selección de acciones de solicitud y tema sin instrucciones previas

El primer nivel se centra en permitir a los agentes identificar de forma autónoma temas relevantes y, a continuación, seleccionar las acciones adecuadas utilizando objetivos en lugar de instrucciones explícitas. El mecanismo central consiste en utilizar una comprensión contextual para responder a las entradas del usuario. Aunque técnicamente se puede añadir cualquier tipo de acción, en este nivel, asumimos que las acciones son acciones de solicitud. Los temas sin instrucciones con acciones de solicitud proporcionan una forma rápida y eficaz de gestionar las consultas más frecuentes.

En este nivel, se hace hincapié en establecer un nivel básico de capacidad de respuesta y autonomía del agente mediante la comprensión dinámica.

2. Instrucciones para el agente

Partiendo de la base de la selección de acciones sin instrucciones, este nivel introduce instrucciones explícitas para guiar el comportamiento del agente. Incorporar instrucciones precisas aumenta el control sobre cómo responden los agentes a diferentes situaciones. Las instrucciones dirigidas a los agentes pueden expresarse en forma de normas, directrices, salvaguardas y ejemplos, y proporcionan al agente pautas específicas sobre cómo manejar diversos temas, ejecutar acciones y procesar los resultados. El objetivo de este nivel es orientar con claridad al agente para aumentar la coherencia y mejorar el cumplimiento de las directrices y los procesos de la empresa.

3. Fundamentación en los datos

La fundamentación consiste en conectar la comprensión y las respuestas del agente con fuentes de conocimiento externas. La fundamentación ayuda a garantizar la precisión, actualización y relevancia de la información proporcionada por el agente. Este nivel integra el acceso a bases de datos, bases de conocimiento y otros repositorios de información. Fundamentar las respuestas del agente en datos verificados mejora su fiabilidad y credibilidad.

4. Variables de los agentes

Este nivel añade la capacidad de los agentes de trabajar con variables. Las variables permiten a los agentes personalizar las interacciones, conservar el contexto a lo largo de varias interacciones y ajustar dinámicamente su comportamiento en función de puntos de datos específicos mantenidos durante la sesión del agente. Por ejemplo, un agente podría recopilar las preferencias del usuario, los detalles del pedido y otra información relevante, y luego utilizar esos datos para personalizar la interacción. Con las variables, los agentes pueden gestionar mejor interacciones más complejas, más pautadas y más personalizadas.

5. Acciones de flujo, Apex y API

El paso final consiste en integrar al agente con las funcionalidades principales de Salesforce: Apex, API y flujos. Gracias a la integración, el agente puede realizar acciones complejas dentro del ecosistema de Salesforce, como acceder y manipular datos, activar flujos de trabajo e interactuar con otros sistemas.

Apex proporciona control programático.
Las API permiten una integración fluida con otras aplicaciones
Los flujos permiten automatizar procesos empresariales complejos.

Este nivel transforma al agente en una potente herramienta capaz de ejecutar tareas sofisticadas y contribuir directamente a los resultados empresariales.

Control agéntico de nivel uno: Razonamiento con selección de acciones de solicitud y tema sin instrucciones previas

Partiendo de una base de capacidad de respuesta y autonomía del agente, pensemos en un agente que solo consta de temas y acciones, y sus correspondientes descripciones. Podemos usar a este agente de ejemplo para presentar los diferentes pasos del motor de razonamiento, y mostrar cómo se utilizan estas descripciones para seleccionar los temas adecuados y las acciones que se ejecutarán. Al omitir las instrucciones del tema en este ejemplo, podemos observar que los agentes de este primer nivel tienen el mayor grado de libertad en comparación con los agentes de niveles más altos. En el nivel uno, el agente es completamente libre de seleccionar la acción que considere apropiada, y se basa únicamente en la conversación en curso.

Gráfico de diagrama de flujo que muestra un árbol de decisión de alto nivel del motor de razonamiento de Agentforce.

Actividad	Pasos	Descripción
Invocación del agente	1	Se invoca al agente.
Clasificación de temas	2-3	El motor analiza el mensaje del cliente y lo asocia con el tema más adecuado en función del nombre del tema y la descripción de la clasificación.
Montaje de contexto	4-5	Una vez seleccionado el tema, el motor recopila el ámbito, las instrucciones y las acciones disponibles del tema junto con el historial de la conversación. (Nota: Las instrucciones se describen en el nivel dos, Control agéntico).
Toma de decisiones		A partir de toda esta información, el motor determina si: • Ejecutar una acción para recuperar o actualizar información • Pedir al cliente más detalles• Responder directamente con una respuesta
Ejecución de acciones	6-8	Si se necesita una acción, el motor la ejecuta y recopila los resultados.
Bucle de acción		El motor evalúa la nueva información y vuelve a decidir qué hacer a continuación, ya sea ejecutar otra acción, solicitar más información o responder.
Comprobación de la fundamentación		Antes de enviar una respuesta final, el motor comprueba que la respuesta: • Se basa en información precisa de acciones o instrucciones • Sigue las pautas proporcionadas en las instrucciones del tema • Se mantiene dentro de los límites establecidos por el ámbito del tema
Envío de la respuesta		La respuesta fundamentada se envía al cliente.

Eche un vistazo a estas cuestiones sobre el motor de razonamiento:

Los ajustes de configuración se fijan para el LLM del motor de razonamiento. Los generadores de agentes no pueden cambiarlos. Actualmente, para las capacidades de razonamiento se utilizan los LLM de OpenAI. Sin embargo, esto está sujeto a cambios a medida que se añaden más modelos.
Historial predeterminado del motor de razonamiento: cada vez que se realiza una solicitud al motor de razonamiento (pasos 2 a 5), recupera automáticamente el historial de las solicitudes y respuestas más recientes. De este modo, se garantiza que el contexto de la conversación se conserva para el motor de razonamiento. Además de las interacciones con los clientes, estas llamadas al LLM del planificador incluyen llamadas al LLM del motor de razonamiento para otras solicitudes, como la selección de temas.

Pasos del razonamiento

El proceso de razonamiento se compone de cuatro pasos principales:

Selección del tema
Selección de acciones
Bucle agéntico
Comprobación de la fundamentación

Paso 1 del razonamiento: Selección del tema

Los temas están diseñados para mejorar la precisión con la que los agentes clasifican la acción o secuencia de acciones. Cada tema debe incluir acciones semánticamente distintas que puedan pertenecer a una misma descripción concisa de un tema y, por lo tanto, englobarse en una función de agente similar.

El LLM del motor de razonamiento selecciona el tema pertinente (paso 2-3 del diagrama). Selecciona el tema cuya descripción de clasificación coincida en mayor medida con el último enunciado, utilizando una solicitud de tema. Esta solicitud de tema contiene las descripciones de la clasificación de todos los temas y el historial de la conversación. Además de los enunciados y las respuestas de los agentes, el historial de la conversación incluye las acciones ejecutadas y sus resultados. La solicitud incorpora instrucciones cruciales que exigen el análisis dentro del contexto del historial de la conversación y que obligan al LLM a compartir su proceso de pensamiento.

Consideraciones adicionales:

Junto a los temas visibles, se incorpora automáticamente un tema oculto adicional para los enunciados "Fuera de tema". Este tema se selecciona cuando ningún otro tema existente se ajusta al enunciado. Esto ayuda al agente a evitar errores de clasificación. Este tema no tiene acciones. Solo existe para ayudar al motor de razonamiento a formular una respuesta adecuada más adelante.
En la solicitud del tema solo se utilizan el nombre y la descripción de la clasificación del tema.
El LLM del motor de razonamiento puede elegir solo un tema a la vez.
Las conversaciones pueden dar un giro de forma inesperada. Cada vez que se recibe un enunciado, el motor de razonamiento pasa al paso de selección de tema, lo que significa que se puede seleccionar un nuevo tema con cada nuevo enunciado.

Prácticas recomendadas para el diseño de temas

La finalidad de los temas es doble:

Reducir el riesgo de confundir al motor de razonamiento agrupando acciones y, por lo tanto, impedir que seleccione las acciones incorrectas.
Orientar la selección y ejecución de acciones con instrucciones (más información en Control agéntico de nivel dos: añadir instrucciones).

Al organizar cuidadosamente las capacidades del agente en temas claramente definidos que se componen de acciones relacionadas, el agente opera de manera más eficaz y predecible, y es más fácil de actualizar y ampliar. Hay dos enfoques posibles para el diseño de temas: descendente y ascendente.

En el enfoque descendente, los temas se diseñan primero como tareas de alto nivel que debe realizar el agente, y luego se definen las acciones individuales para esos temas.
En el enfoque ascendente, primero se definen todas las acciones individuales, que luego se agrupan en temas.

Ambos enfoques dan buenos resultados si se siguen correctamente.

Enfoque ascendente

En esta sección se explica el enfoque ascendente, ya que se ajusta perfectamente a las razones por las que el motor de razonamiento necesita temas con los que empezar.

Paso 1: Enumerar todas las acciones de agente

Empiece por enumerar todas las acciones específicas que el agente debe ser capaz de realizar. En esta etapa, es mejor ser muy específico que demasiado general. Evite intentar agrupar o simplificar las acciones de forma prematura. El objetivo es crear una visión completa y detallada de lo que puede hacer el agente.

Por ejemplo, en el caso de un agente de servicio al cliente, la lista inicial podría incluir:

Devolver un pedido: para iniciar el proceso de devolución de un pedido.
Consultar la disponibilidad de inventario: para verificar si hay existencias de un producto.
Consultar políticas de cambio de productos: para recuperar información sobre las reglas para cambiar productos.
Responder preguntas con conocimiento: para responder a preguntas generales o similares a las preguntas frecuentes.
Consultar promociones: para comprobar si hay promociones o descuentos disponibles.
Predecir fecha de entrega: para estimar la fecha/hora de entrega prevista.
Comprobar el estado del pedido: para revisar el estado actual del pedido de un cliente.
Buscar pedidos de clientes: para recuperar todos los pedidos pasados o activos de un cliente específico.
Solucionar problemas técnicos: para resolver problemas técnicos con un producto o servicio.
Buscar términos de pedidos de clientes: para recuperar todos los términos relacionados con un pedido.
Buscar activos de clientes: para identificar o recuperar activos asociados con un cliente.
Cambiar la dirección de entrega.

Tenga en cuenta que una acción como "Resolver reclamaciones de clientes" es demasiado general en este momento. Las acciones deben representar el nivel más pequeño de granularidad en el comportamiento del agente. Las reclamaciones pueden ser de muchos tipos, y diferentes acciones ya las abordan:

Los problemas posteriores a la entrega, como la resolución de problemas de productos dañados o que no funcionan correctamente, ya están cubiertos por "Solucionar problemas técnicos".
Los problemas previos a la entrega, como entregas perdidas, la necesidad de cambiar las fechas de entrega o la modificación de pedidos, ya están cubiertos por acciones como "Comprobar el estado del pedido", "Predecir fecha de entrega" o "Devolver un pedido".
Las consultas generales de los clientes, como las preguntas sobre políticas, ya están cubiertas en "Responder a las preguntas con conocimiento" o "Consultar políticas de cambio de productos".

Paso 2: Marcar los pares (o múltiplos) de acciones que puedan causar confusión en el razonamiento

Marque las acciones que sean de naturaleza similar y puedan causar confusión al motor de razonamiento. Sus descripciones no serán lo suficientemente diferentes desde el punto de vista semántico, por lo que el motor de razonamiento no sabrá qué acción seleccionar en el paso 5.

Por ejemplo, "Resolución de problemas técnicos" y "Responder preguntas con conocimiento" tienen descripciones similares, pero su funcionalidad puede diferir significativamente. Marcar estas superposiciones semánticas ayudará a identificar qué acciones separar en varios temas.

Paso 3: Crear agrupaciones iniciales de acciones en temas

Una vez que las acciones están claramente definidas y se han identificado sus solapamientos semánticos, las acciones pueden agruparse en temas preliminares. Un tema es una categoría lógica de funcionalidad, una agrupación de acciones, que juntas representan una capacidad o habilidad coherente del agente.

Al crear estas agrupaciones:

Evite la superposición semántica utilizando el número mínimo de temas necesarios.
Asegúrese de que cada tema contenga acciones que estén relacionadas de manera significativa.
Asegúrese de que las acciones de apoyo que deban ejecutarse en una cadena estén presentes en el mismo tema.

Este es un ejemplo de una agrupación inicial para un agente de servicio al cliente:

Tema 1:

Devolver un pedido
Consultar la disponibilidad de inventario
Consultar las políticas de cambio de productos
Consultar promociones
Predecir la fecha de entrega
Encontrar los términos de pedidos de los clientes
Comprobar el estado del pedido
Buscar pedidos de clientes
Buscar activos de clientes
Responder a las preguntas con conocimiento
Cambiar la dirección de entrega

Tema 2:

Solucionar problemas técnicos
Buscar activos de clientes

Paso 4: Escribir descripciones de clasificación para los temas y dividir los temas si es necesario

Una vez que tenga la agrupación inicial, escriba descripciones de clasificación para cada tema.

El tema 2 de nuestro ejemplo trata claramente de problemas técnicos con los productos.
El tema 1, sin embargo, tiene un ámbito más amplio. Se trata en gran medida de la gestión de pedidos, pero también contiene algunas acciones que no están relacionadas con la gestión de pedidos, como consultar promociones y responder preguntas con conocimiento. El tema 1 no se puede describir de manera clara y concisa en una sola oración y, por lo tanto, el tema debe dividirse en diferentes temas.

Después de ajustar esta cuestión, obtenemos lo siguiente:

Tema 1: Gestión de pedidos: describe las acciones relativas a la gestión y modificación de los pedidos de los clientes y la logística relacionada, excepto todo lo correspondiente con el cambio y la devolución.
- Consultar la disponibilidad de inventario: determinar si hay existencias de un producto.
- Predecir la fecha de entrega: estimar cuándo llegará un pedido.
- Comprobar el estado del pedido: encontrar el estado del pedido de un cliente.
- Buscar pedidos del cliente: recuperar todos los pedidos realizados por un cliente.
- Cambiar la dirección de entrega.
Tema 2: Resolución de problemas
- Buscar activos del cliente: recuperar los dispositivos o productos registrados del cliente.
- Solucionar problemas técnicos: proporcionar asistencia técnica o diagnósticos.
Tema 3: Cambios: describe las acciones relacionadas con los cambios y la devolución de pedidos.
- Devolver un pedido: iniciar el proceso de devolución de un pedido.
- Consultar las políticas de cambio de productos: proporcionar las reglas de cambio para los productos.
- Buscar pedidos del cliente: recuperar todos los pedidos realizados por un cliente.
- Buscar términos de pedidos de clientes: recuperar todos los términos relacionados con un pedido.
Tema 4: Soporte de productos: describe las acciones transversales utilizadas para la recuperación y el enrutamiento de información.
- Responder a las preguntas con conocimiento: responder a las consultas generales de los clientes utilizando la información de la base de conocimientos.
- Consultar promociones: consultar las promociones o descuentos actuales.

Para recapitular, primero se crea una lista completa de todas las acciones posibles, luego se marca la superposición semántica entre estas acciones. A continuación, debe crearse un conjunto de temas que, como mínimo, resuelva toda la superposición semántica (para que el motor de razonamiento no se confunda dentro de los límites de un tema). Después, se escribe la descripción de clasificación de cada tema. Si los temas tienen un ámbito demasiado amplio, hay que dividirlos en temas más granulares. Si sigue estos pasos, creará un agente que no solo funcione bien, sino que también sea fácil de mantener y ampliar.

Esta estructura admite un mejor razonamiento, una ejecución más precisa y límites de decisión más claros en el comportamiento del agente. También se basa en la colaboración entre diseñadores, ingenieros y expertos en la materia para hacer que las capacidades del agente sean más transparentes y modulares.

Otras consideraciones para la creación efectiva de temas

Número óptimo de temas: para mejorar el rendimiento de los LLM a la hora de clasificar el tema correcto, por lo general, es recomendable no exceder los 10 temas. Sin embargo, esto es solo una regla general. También es necesario tener en cuenta que cada tema debe tener una descripción clara y diferenciada. En última instancia, el número óptimo de temas depende de la distancia semántica entre las descripciones de clasificación de temas. Si los temas tienen descripciones de clasificación que difieren mucho, se minimiza el riesgo de superposición de temas. Aquí se describen más prácticas recomendadas para evitar la superposición entre temas.
Equilibrio entre tamaño y claridad en los temas: si bien generalmente es beneficioso que los temas sean pequeños en términos de acciones e instrucciones para que la clasificación sea más fácil, crear demasiados temas con descripciones muy similares puede generar confusión, al igual que la superposición semántica entre acciones lleva a errores de clasificación. Por ello, es importante que las descripciones de los temas estén claramente diferenciadas semánticamente. Puede usar LLM para ayudarle a crear clasificaciones bien diferenciadas.
Lenguaje estándar y claridad contextual: es posible que los LLM no conozcan los significados y abreviaturas específicos de la empresa o el negocio. Use un lenguaje estándar o sea muy explícito a la hora de explicar los significados de las palabras dentro de su contexto particular.
En la solicitud del tema solo se envían el nombre y la descripción del tema. Por lo tanto, cambiar el ámbito o las instrucciones del tema no tendrá ningún impacto en la selección del tema.

Ejemplo práctico

Imagine que un agente de servicio recibe una solicitud sobre la póliza de garantía para un reloj. El tema de la garantía no parece estar relacionado con el cambio o el soporte del producto. La gestión de pedidos parece ser el tema más apropiado para abordar esta solicitud. Por lo tanto, el motor de razonamiento elige este último tema como el más probable para cumplir con la solicitud.

Gráfico que muestra el flujo de la clasificación de temas desde la conversación del agente hasta el plan.

Paso 2 del razonamiento: selección de acciones

Tras la selección del tema, el motor de razonamiento selecciona las acciones adecuadas que se deben ejecutar a partir del tema seleccionado. Una vez más, el LLM del motor de razonamiento es el responsable de esto, utilizando otra solicitud llamada la solicitud de observación. La finalidad de la solicitud de observación es obtener el siguiente paso en el proceso de razonamiento. El siguiente paso puede ser cualquiera de los siguientes:

Iniciar una acción
Solicitar entradas de acción por parte del usuario
Solicitar al usuario que aclare la solicitud
Enviar la respuesta final al usuario (cumplir con la solicitud del usuario) una vez que se ha completado el ciclo de la acción (para obtener más detalles, consultar el paso 3 del razonamiento)

La entrada a la solicitud de observación está formada por todas las descripciones de todas las acciones del tema, así como del historial de conversaciones.

Prácticas recomendadas para el diseño de acciones

Las acciones son las tareas predefinidas que el agente puede realizar para hacer su trabajo. Las acciones son las definiciones más detalladas del trabajo. Hay cinco tipos diferentes de acciones de agente: (1) ejecutar código Apex, (2) llamar a una API, (3) ejecutar un flujo, (4) obtener una respuesta de LLM a una plantilla de solicitud y (5) llamar a un modelo predictivo. La mayoría de estas acciones pueden ser deterministas. Una excepción es obtener una respuesta a una plantilla de solicitud (siempre que la acción de Apex, el flujo o el sistema externo no contenga elementos probabilísticos como invocaciones de solicitud). Abordaremos estos temas en el quinto nivel de control agéntico.

Controlar el comportamiento de los agentes en acciones de solicitud. Hay dos formas de controlar el comportamiento del agente en las acciones de solicitud: (1) añadir más instrucciones a la plantilla de solicitud mediante la ingeniería de solicitudes, y (2) configurar los hiperparámetros del LLM que genera la respuesta a la solicitud, en particular la temperatura (consulte la documentación ). La reducción de la temperatura reduce la variabilidad en las respuestas generadas, lo que aumenta su repetibilidad y la fiabilidad del agente.
Número óptimo de acciones dentro de un solo tema: similar al número máximo de temas, el número de acciones dentro de un tema no debe ser superior a 10. Pero, de nuevo, esta es una regla general. El factor realmente determinante es la distancia semántica entre las acciones. Cuando las acciones se distinguen claramente por su descripción, este número puede ser mayor. Sin embargo, no existe una medida numérica para la distancia semántica; depende de la interpretación del generador de agentes. Cuanto mayor sea la diferencia de significado entre las descripciones de las acciones, mayor será la distancia semántica. Aquí se debe evitar la superposición en todo momento.
Descripciones de las acciones: Contrariamente a lo que sugiere el nombre, la "instrucción de acción" en realidad sirve como una instrucción que el LLM del motor de razonamiento usa para seleccionar la acción correcta del tema. Tenga en cuenta que el uso de descripciones de acciones semánticamente distintivas puede mejorar considerablemente la calidad de sus clasificaciones. Revise cuidadosamente estas descripciones y, sobre todo, compare todas las descripciones de acciones que pertenezcan a un mismo tema.

Ejemplo práctico

Continuemos con el ejemplo anterior en el que un agente de servicio recibe una pregunta sobre la política de garantía de un reloj. Después de seleccionar el tema Gestión de pedidos, se elige la acción más probable. Dado que este es el tema de gestión de pedidos, el primer paso lógico es buscar el pedido (de lo contrario, ¿para qué se recupera la información de la garantía?) iniciando la acción de búsqueda de pedidos.

Gráfico que muestra el flujo de clasificación de acciones de una conversación de agente a un plan.

Paso 3 del razonamiento: el bucle agéntico

Un enunciado del usuario puede desencadenar la ejecución de varias acciones antes de que se envíe una respuesta al usuario. Esto se debe al bucle agéntico, que continúa seleccionando y ejecutando la siguiente acción más adecuada hasta que se cumple una de las siguientes condiciones:

El LLM del motor de razonamiento determina que la solicitud está completa. En este caso, se determina que la respuesta satisface la solicitud del usuario. Tenga en cuenta que parte de esta comprobación incluye una comprobación de la fundamentación, que verifica que la respuesta se fundamenta en las salidas de acción. El LLM del motor de razonamiento no debe inventar ninguna información en la respuesta, ya que esto podría dar lugar a respuestas incorrectas o alucinaciones.
No se encuentran más acciones adecuadas.
Se alcanza el máximo permitido de llamadas al LLM para el paso actual. Este número lo establece el propio motor de razonamiento.

Las acciones no están sujetas a un tiempo de espera específico. Esto es para evitar interrupciones cuando los tiempos de ejecución de las acciones varían en función de su complejidad. Algunas acciones son simplemente más complejas de ejecutar que otras.

Ejemplo práctico

Después de iniciar una búsqueda de pedido, el motor de razonamiento evalúa la respuesta generada hasta el momento y decide si es necesario realizar más tareas antes de enviar una respuesta al usuario. Ahora que el pedido aparece en el historial de conversaciones, es el momento de consultar la política de garantía.

Gráfico que muestra el bucle sobre la clasificación de la siguiente acción en el flujo desde la conversación del agente hasta el plan.

Sin embargo, al hacerlo, el agente se da cuenta de que el cliente ha comprado dos relojes, tal y como se ha recuperado mediante la acción "búsqueda de pedidos". Por lo tanto, en el bucle agéntico, el motor de razonamiento decide ahora pedir al cliente que especifique para qué reloj en concreto necesita información sobre la garantía.

Gráfico que muestra el motor de razonamiento en acción en el flujo de una conversación de agente al plan.

Control agéntico de nivel dos: instrucciones

La fiabilidad del agente se ve reforzada por una distribución cuidadosa de las acciones entre los distintos temas y por una descripción detallada de las acciones y los temas. Sin embargo, estos métodos no permiten expresar reglas de negocio, políticas y salvaguardas dentro del motor de razonamiento. Las instrucciones proporcionan una capa adicional importante de control agéntico. Las instrucciones ofrecen más orientación al motor de razonamiento cuando se usan varias acciones juntas. Esto permite un enfoque más matizado y basado en políticas para el comportamiento de los agentes. Con las instrucciones, los generadores de agentes pueden garantizar que los agentes no solo funcionen de forma fiable, sino que también cumplan las normas empresariales establecidas y las prácticas recomendadas.

Las instrucciones que se escriben a nivel de tema se convierten en parte de la solicitud de observación. Las instrucciones del tema guían al motor de razonamiento en la elección de las acciones adecuadas. Pueden proporcionar instrucciones sobre cuándo seleccionar qué acción y se pueden usar para definir la dependencia de la acción. En determinadas circunstancias, también pueden aplicar el control secuencial. Sin embargo, existen alternativas para ello y se deben seguir cuidadosamente las instrucciones para ese requisito. Las instrucciones del tema se agregan una por una y aparecen en cuadros separados en la interfaz de usuario, pero siempre se envían juntas a la solicitud de observación. Añadir instrucciones en recuadros separados aumenta la legibilidad y la facilidad de mantenimiento del tema, pero no afecta al motor de razonamiento.

En ocasiones, las instrucciones se aplican de forma global al agente y no están relacionadas con un tema concreto. La funcionalidad para mantener las instrucciones globales está actualmente en la hoja de ruta del producto. Las prácticas recomendadas para la redacción de instrucciones de temas se pueden encontrar en la Guía de Agentforce sobre temas, instrucciones y acciones. Repasemos algunas pautas adicionales.

Prácticas recomendadas para la redacción de instrucciones

Evitar guiones demasiado rígidos

Es importante evitar definir en exceso la forma en que los agentes deben conversar con los usuarios. El exceso de guionización puede limitar la capacidad de un agente para establecer una buena relación con el cliente, comprender sus necesidades específicas y responder de manera eficaz en tiempo real a circunstancias dinámicas. Además, las instrucciones largas pueden ralentizar la respuesta del agente y confundir al motor de razonamiento. Forzar el determinismo mediante instrucciones no es el enfoque preferido.

Qué no hacer

Por ejemplo, no es necesario decirle a un agente que evite referirse a los competidores en las respuestas de servicio. Esto puede dar lugar a comportamientos no deseados, ya que el agente también puede negarse a responder a preguntas relacionadas con la integración con un proveedor que a la vez sea un competidor. En su lugar, la instrucción puede ser algo así como "Cuando se hable de la competencia, responde teniendo en cuenta los intereses de la empresa". De este modo, se evitan instrucciones restrictivas y condicionales como "Menciona solo al competidor xyz en el caso de...", y se aprovechan las capacidades de razonamiento del LLM. En este ejemplo se muestra cómo es posible dar instrucciones a un nivel más general y abstracto, de forma similar a como se formaría a un empleado humano tras incorporarse al departamento de atención al cliente de la empresa.

Veamos algunos ejemplos más de lo que no se debe hacer. A continuación, se muestran algunas instrucciones formuladas incorrectamente, proporcionadas a un agente de servicio que gestiona perfiles de candidatos en un sitio web de contratación. Estas instrucciones intentan anticipar todas las posibles respuestas de los clientes y, por lo tanto, deben evitarse:

Instrucción 1: El agente recibe el siguiente enunciado: "¿Puedo añadir una imagen a mi perfil?" A continuación, pregunta inmediatamente al cliente: "¿Qué tipo de perfil tienes?"

Instrucción 2: Si el cliente indica que tiene un perfil premium, responde "Déjame comprobar los detalles de tu contrato", busca los detalles del contrato y comprueba si, en el contrato, se acordó que se podía actualizar la foto de perfil.

Si se acordó que el candidato puede hacerlo, responde "Sí, es posible; puedo encargarme de actualizarla". ¿Puedes proporcionar tu nueva foto?" Una vez que se reciba la imagen, actualiza el perfil del candidato en consecuencia. Si el contrato no incluye cambios en la foto del perfil, diga di "Lo siento, no es posible". "Voy a derivarte a un agente humano".

Instrucción 3: Perfil no premium: Si el cliente indica que tiene un perfil no premium, responde "No puedes actualizar la foto. Si deseas hacerlo, dímelo y te transferiré con un agente humano".

Instrucción 4: Si no queda claro el tipo de perfil, responde "No he entendido tu tipo de perfil".

Qué hacer en su lugar

En lugar de este tipo de control minucioso, es preferible aplicar un enfoque más flexible que oriente el comportamiento y la conducta de los agentes. Es importante tener en cuenta las siguientes prácticas recomendadas:

Utilizar RAG o acciones de conocimiento para las políticas y reglas que están en los artículos de conocimiento (en vez de escribirlas como instrucciones). La información relevante se recuperará en el momento adecuado. En el ejemplo anterior, eso significa que el artículo de conocimiento titulado "Actualización de imágenes" debe indicar: "Solo los candidatos con un perfil premium cuyo contrato permita cambiar la foto pueden actualizar su foto".
Describir las pautas y salvaguardas principales individualmente, independientemente de la conversación. Es esencial dar a los agentes una explicación clara y concisa del comportamiento o procedimiento esperado en cuestión.

Según estas prácticas recomendadas, un conjunto de instrucciones más adecuado podría ser el siguiente:

Instrucción 1 : “Utiliza acciones de conocimiento para comprobar las políticas en caso de solicitudes de cambios en la cuenta".

Instrucción 2 : No respondas a preguntas para las que no se haya encontrado ninguna política aplicable".

La aplicación de las pautas anteriores puede mejorar los resultados del agente. Ahora, si el cliente solicita al agente un cambio de perfil, el agente comprenderá que necesita recuperar la política requerida de la base de conocimiento, interpretar las reglas recuperadas, aplicar esas reglas al contexto y, finalmente, responder al cliente. A diferencia de la guionización excesiva, este enfoque conductual es mucho más genérico y ampliamente aplicable. Sin tener que escribir cada conversación posible, el agente ahora puede responder de manera flexible con el comportamiento deseado a una gama más amplia de temas de conversación.

Forzar la secuencia de acciones

La solicitud de observación incluye instrucciones y descripciones de acciones, pero sin un orden definido. Si la secuencia de acciones es crítica, debe indicarse explícitamente dentro de la misma instrucción.

Sigamos con el ejemplo de los agentes del sitio web de contratación. El agente debe ser capaz de gestionar la planificación de las entrevistas con el entrevistador adecuado. Para ello, debe comprobar primero la disponibilidad de los responsables de selección y, a continuación, proponer tres posibles franjas horarias al candidato.

En este caso, para mantener el orden de ejecución, las instrucciones no deberían estar en cuadros separados:

Instrucción 1: Comprueba la disponibilidad de los entrevistadores.
Instrucción 2: Entonces, propón a los candidatos las franjas horarias adecuadas.

Estas instrucciones no funcionan porque el motor de razonamiento no sabe a qué se refiere "Entonces" en la instrucción 2. Esto se debe a que las instrucciones se envían al motor de razonamiento como un grupo, sin ningún orden en particular.

En su lugar, las instrucciones que definen la secuencia deben combinarse en una sola instrucción y escribirse así:

Instrucción 1: Comprueba la disponibilidad de los entrevistadores. Entonces, propón a los candidatos las franjas horarias adecuadas.

Forzar la salida de una acción sin reescribir

El motor de razonamiento es en sí mismo un LLM. Es responsable de generar la respuesta final de acuerdo con el bucle agéntico. Este enfoque es necesario para hacer cumplir las instrucciones del agente que proporcionan salvaguardas para la generación de respuestas, o para combinar los resultados de múltiples acciones que formaban parte del bucle agéntico, con el fin de satisfacer la solicitud del usuario.

Sin embargo, cuando la expectativa es que solo se ejecute una acción de solicitud, se puede implementar una instrucción para indicar al agente que nunca cambie la salida de una acción. De este modo, se garantiza un comportamiento más predecible y fiable por parte de los agentes.

Imponer este cumplimiento estricto en las plantillas de solicitudes aprobadas resulta crucial en determinados escenarios, especialmente cuando la coherencia, el cumplimiento y los mensajes predefinidos son importantes. A continuación, se incluyen dos ejemplos:

Sectores industriales regulados: las organizaciones que operan en sectores altamente regulados (como el financiero, el sanitario o el jurídico) suelen requerir un control estricto de todas las comunicaciones con los clientes. Las plantillas de solicitud aprobadas garantizan que las respuestas cumplan con los requisitos legales y normativos, lo que minimiza el riesgo de malas interpretaciones, responsabilidades o difusión de información inexacta.
Respuestas probadas y validadas previamente: las plantillas de solicitud se pueden someter a pruebas y validaciones rigurosas para garantizar la precisión, la eficacia y los resultados deseados. Desviarse de estas plantillas puede socavar su eficacia y valor. El cumplimiento estricto garantiza que los mensajes probados se entreguen de manera coherente.

Esta instrucción limita la libertad del agente para cambiar la salida de las acciones. Asegúrese de que la instrucción hace referencia a la salida de la plantilla de solicitud (como "promptResponse"), como se muestra en este rastreador de planes.

Interfaz de usuario de Salesforce que muestra el seguimiento de planes dentro del razonamiento del agente.

En este caso, la instrucción puede ser:

“ No cambiar la salida de promptResponse, independientemente del canal del agente ”.

Limitaciones en la aplicación del cumplimiento estricto:

Cuando una interacción requiere múltiples acciones distintas por parte del agente, no es viable exigir el cumplimiento estricto de una única plantilla. De hecho, en este escenario, el motor de razonamiento necesita consolidar estas acciones en una única respuesta y, por lo tanto, cambiar cada uno de los resultados de las acciones.

Número óptimo de instrucciones

Según las características generales del LLM, el número objetivo de instrucciones oscila entre 5 y 10, dependiendo de la complejidad de las instrucciones y de la interacción entre ellas. Estas características de las instrucciones influyen en el número de instrucciones que puede seguir el motor de razonamiento:

Claridad y especificidad: las reglas bien definidas son más fáciles de seguir.
Conflictos entre reglas: si las reglas se contradicen entre sí, se requiere lógica adicional para resolver esos conflictos.
Longitud y complejidad: si cada regla requiere un razonamiento profundo, es mejor dividirlas en instrucciones más pequeñas.

Si es muy importante seguir una instrucción explícitamente, es importante añadir términos que reflejen su importancia:

Urgencia e importancia (inmediata, urgente, crítica, esencial, obligatoria)
Autoridad y cumplimiento (requerida, obligatoria, estrictamente aplicada)
Consecuencias y advertencias (la infracción resultará, el incumplimiento conducirá, el incumplimiento puede llevar a, se aplican sanciones estrictas, tolerancia cero)
Claridad y concisión (debe, prohibido, no permitido, siempre/nunca)

Control agéntico de nivel tres: Fundamentación

Fundamentar las respuestas en datos mejora significativamente la fiabilidad y credibilidad de los agentes. Las respuestas fundamentadas se basan en información objetiva en lugar de en especulaciones o conocimientos obsoletos. La generación aumentada por recuperación (RAG) es una técnica ampliamente adoptada que permite a un agente acceder y utilizar una base de conocimientos para formular respuestas más precisas y contextualmente relevantes. En función de la consulta del usuario, el agente emplea la RAG para recuperar información relevante de las fuentes de datos aplicables y, a continuación, completa la solicitud con esta información antes de enviarla al LLM. Los agentes que recurren a la RAG ofrecen una mayor calidad, precisión y utilidad general en las interacciones, lo que aumenta la confianza y la satisfacción de los usuarios. Las prácticas recomendadas para la RAG se describen ampliamente en un documento técnico disponible públicamente llamado Agentforce and RAG: best practices for better agents. .

Conocimiento e instrucciones

Es importante diferenciar entre conocimientos e instrucciones a la hora de encontrar el equilibrio adecuado entre orientación y flexibilidad, ya que cumplen funciones diferentes:

Conocimiento: piense en el conocimiento como la biblioteca de libros a la que tiene acceso el agente mientras genera sus respuestas. Algunos ejemplos son documentos, artículos de conocimiento o documentos técnicos. Tenga en cuenta que estos pueden incluir políticas y reglas generales de la empresa. El conocimiento también puede referirse a archivos transaccionales, como correos electrónicos, transcripciones de llamadas e incluso el historial de conversaciones (de agentes). Finalmente, el conocimiento incluye campos de texto largo en datos estructurados. El conocimiento generalmente se lleva al agente a través de la RAG.
Instrucciones: piense en las instrucciones como el conjunto mínimo de reglas para orientar al agente sobre cuándo debe utilizar cada acción. Las instrucciones también pueden establecer salvaguardas para toda la conversación, como el tono de voz que se debe utilizar. A menudo, las instrucciones pueden ser más concisas y flexibles sin sacrificar la claridad ni la intención. En lugar de proporcionar un guion rígido con respuestas específicas para cada posible situación con un cliente, considere la posibilidad de implementar directrices y principios generales que ayuden al agente a seleccionar la acción o acciones adecuadas en diversas situaciones.

Generación aumentada de recuperación

La generación aumentada de recuperación (RAG) actúa como una capa de datos inteligente para el conocimiento. Brinda a los agentes acceso a información en varios formatos y proporciona fragmentos de texto relevantes para responder preguntas. Con la RAG, los agentes pueden obtener respuestas de LLM más precisas sin saturar la solicitud del LLM con contenido superfluo ni exceder su ventana de contexto.

En tiempo de ejecución, la RAG ejecuta tres pasos:

Recuperación: el sistema de IA busca en una gran base de datos o fuente de conocimiento para recopilar información relevante para la solicitud de LLM. Esto se hace mediante la búsqueda semántica, una técnica más sofisticada en comparación con la búsqueda tradicional basada en palabras clave. A diferencia de la búsqueda por palabras clave, que encuentra términos exactos, la búsqueda semántica entiende el significado o el contexto detrás de las palabras. Identifica la información relevante basándose en los conceptos o las relaciones entre los términos, en lugar de limitarse a buscar coincidencias exactas entre palabras. La búsqueda por palabras clave también puede desempeñar un papel importante en este proceso de recuperación, reforzando la búsqueda semántica con la coincidencia de palabras clave para terminología o nombres específicos. Este tipo de búsqueda se denomina búsqueda híbrida.
Aumento: la información recuperada se añade a la solicitud.
Generación: el LLM genera una respuesta contextualmente apropiada y más precisa gracias a la solicitud aumentada (o completada) con el conocimiento recuperado.

En Agentforce, la RAG se puede utilizar con o sin una plantilla de solicitud:

RAG basada en solicitudes: en este enfoque, las instrucciones que especifican cómo generar la respuesta se encuentran en las instrucciones de la solicitud en una plantilla de solicitud. En este caso, la respuesta depende completamente de lo que genere el LLM. Aparte de las instrucciones de la solicitud, hay formas de influir en la respuesta, como los ajustes de configuración de LLM en Einstein Studio, pero el resultado sigue sin ser determinista.
RAG basada en el motor de razonamiento: en lugar de utilizar una plantilla de solicitud, el agente utiliza una acción que recupera fragmentos (a través de un flujo o una clase Apex) y los almacena en una variable (consulte la siguiente sección). En este enfoque, el motor de razonamiento (en lugar del LLM) genera respuestas directamente, fundamentándose en los datos recuperados. Las instrucciones que rigen la generación de respuestas son instrucciones del agente en lugar de instrucciones de la plantilla de solicitud. La variable que contiene el contenido recuperado se puede pasar explícitamente como entrada a una acción. También se puede proporcionar al motor de razonamiento concediéndole acceso predeterminado al contenido de la variable. Este enfoque tiene ventajas e inconvenientes. Existe el riesgo potencial de sobrecargar el motor de razonamiento con contenido y responsabilidad. Además, a diferencia de una solicitud, los parámetros del LLM del motor de razonamiento no son configurables. Por otro lado, el motor de razonamiento puede generar su respuesta utilizando tanto los fragmentos recuperados como el historial de la conversación.

El método recomendado es la opción 1. Reduce la cantidad de tareas que debe realizar el motor de razonamiento y, por lo tanto, mejora la calidad de su respuesta. En la siguiente sección analizaremos una excepción a esta regla, en la que el contenido se conserva a lo largo de toda la conversación y, por lo tanto, se asigna explícitamente a una acción.

Gráfico de diagrama de flujo que muestra un flujo de agente con RAG entre la plataforma y Data 360.

Prácticas recomendadas de RAG

Evitar las instrucciones RAG programadas de forma rígida: en lugar de vincular directamente las instrucciones a artículos específicos para preguntas concretas, aprovecha la inteligencia de RAG para encontrar de forma dinámica la fuente de datos más relevante y el fragmento de texto más preciso. El proceso de coincidencia de RAG se basa en una comprensión más amplia de la pregunta, no solo en una correlación exacta entre pregunta y fuente.
Consolidación de temas: agrupar categorías de preguntas relacionadas en un solo tema. La RAG puede identificar eficazmente las respuestas relevantes en función del tipo de pregunta, incluso dentro de un tema más amplio. Por ejemplo, los problemas relacionados con el producto, como el mantenimiento y los problemas con la batería, se pueden agrupar en un tema más amplio.

Almacenamiento del resultado de RAG en una variable: cuando se alcance el número de límites de interacción, conviene guardar el resultado de RAG en una variable. De este modo, la información permanece accesible para orientar las interacciones de los agentes más allá del umbral estándar. En la siguiente sección se proporcionará un ejemplo.

Control agéntico de nivel cuatro: variables

Ciertos procesos de negocio exigen una ejecución aún más predecible, como la aplicación de una secuencia de acciones específica o condiciones para desencadenar acciones o temas.

Para lograr este comportamiento determinista, se pueden usar variables. Las variables funcionan como una forma estructurada de memoria de agente a corto plazo que puede servir como entradas o salidas de acciones. Además, el estado de una variable puede determinar la activación de temas y acciones específicos.

Formas en que las variables respaldan la determinación

Las variables pueden ayudar a lograr el determinismo guiado de los agentes de las siguientes maneras:

Fundamentación dinámica persistente: las variables permiten a los agentes actualizar continuamente su comprensión del mundo, al tiempo que conservan información importante que no se ve afectada por ninguna interacción posterior. Este método garantiza que la información crítica, que puede tener la forma de datos no estructurados recuperados a través de la generación aumentada por recuperación (RAG) o de datos estructurados, como la información del perfil del usuario, se conserva durante toda la conversación, independientemente de su duración.
Entradas/salidas de acciones: las variables se pueden utilizar como parámetros de entrada y salida para las acciones. La acción se refiere explícitamente a variables, y la ejecución de la acción no depende del motor de razonamiento para establecer esas entradas y salidas, lo que aumenta el determinismo del agente.
Filtrado: las variables se pueden utilizar para determinar la ejecución condicional de acciones o temas. Las variables permiten un flujo específico de información entre las acciones y el determinismo en la ejecución de la acción. Esta capacidad es especialmente importante para las reglas de seguridad en las que no se pueden iniciar acciones si no se verifican variables de entrada específicas, como el correo electrónico.

Tipos de variables en Agentforce

Agentforce tiene dos tipos de variables:

Las variables de contexto son variables generadas por el sistema que contienen información sobre el usuario y las sesiones de conversación.
El usuario puede crear instancias de variables personalizadas. Contienen cualquier tipo de información utilizada para cualquiera de las tres formas en que las variables respaldan el determinismo.

Cada tipo de variable incluye una serie de capacidades:

	Variables de contexto	Variables personalizadas
El usuario puede crear la instancia	X	✓
Puede ser una entrada de acciones	✓	✓
Puede ser una salida de acciones	X	✓
Se puede actualizar mediante acciones	X	✓
Se puede utilizar en filtros de acciones y temas	✓	✓

Ejemplo de caso de uso

Profundicemos en las variables con un ejemplo de caso de uso: un agente de resolución de problemas orientado a los clientes. En este ejemplo, las variables se utilizan para las tres finalidades: fundamentación dinámica persistente, entradas/salidas de acciones y filtrado.

En este ejemplo, el agente ayuda a un cliente a solucionar un problema técnico del dispositivo. La resolución de problemas generalmente implica realizar una serie de pasos. El agente debe ofrecer una experiencia de servicio que imite el trabajo de un agente humano. Para ello, el agente no debe proporcionar a la vez todos los pasos de la resolución del problema al cliente. En su lugar, debe ofrecerle instrucciones paso a paso, junto con la capacidad de pasar de un paso a otro (incluida la posibilidad de volver a pasos abordados anteriormente) en función de cómo responda el cliente.

Uno de los retos que esto plantea es la capacidad del agente para recordar todos los pasos de resolución de problemas a lo largo de la conversación. Dada la memoria limitada del agente debido al número restringido de interacciones que puede almacenar, estos pasos pueden eliminarse del contexto del motor de razonamiento si la conversación se alarga.

La forma de abordar este problema es utilizar una variable para fundamentar el motor de razonamiento de forma dinámica en todos los pasos de resolución de problemas. Al recuperar la información y almacenarla en una variable, permanece disponible y se puede actualizar a lo largo de la conversación. El motor de razonamiento utiliza la información almacenada en esta variable para la fundamentación dinámica.

Recuperación, configuración y uso de los pasos de resolución de problemas

En este ejemplo, un tema incluye dos acciones. Estas dos acciones son necesarias para mantener un flujo de datos coherente. La primera acción se usa para rellenar la variable que contiene todos los pasos de resolución de problemas. La segunda acción usa esa variable durante la resolución de problemas en sí.

Acción 1: "Rellena los pasos de resolución de problemas". Esta es la acción inicial, desencadenada por la primera introducción del agente al problema. Utiliza la generación aumentada por recuperación para extraer todos los pasos de resolución necesarios de una base de conocimiento indexada. La acción almacena la salida resultante en una variable denominada "Pasos de resolución".
Acción 2: "Utilizar en medio de la resolución de un problema". Esta es una acción basada en una solicitud que genera el siguiente paso de resolución de problemas más probable que se utilizará durante el proceso de resolución del problema. Se indica al agente que use esta acción mientras está resolviendo un problema.

La pregunta original del cliente se incluye como entrada en ambas acciones. La segunda acción tiene otra entrada: el contenido de la variable "Pasos de resolución". Esta variable se ha establecido por la primera acción. Tenga en cuenta que la segunda acción no recuperará los pasos de resolución de problemas por sí misma, sino que los obtendrá como entrada de la primera acción a través de la variable. En el diagrama siguiente se muestra el flujo de datos entre esas dos acciones.

Gráfico de diagrama de flujo que muestra las etapas de recuperación, configuración y uso de la resolución de problemas.

La acción "Utilizar en medio de la resolución de un problema" siempre hará referencia a los pasos de resolución de problemas originales recuperados por la acción Pasos de resolución de problemas. Este flujo de datos garantiza que los pasos de solución de problemas se mantengan de forma coherente y siempre presentes, independientemente de la duración de la conversación.

Uso de filtros para asegurar el orden de ejecución de las acciones

Para ejecutar las acciones definidas en este ejemplo, se necesitan instrucciones específicas, como "Ejecuta siempre primero los 'pasos de resolución Rellenar'". Sin embargo, dada la naturaleza no determinista de los LLM utilizados por los agentes, esto puede conducir a un orden diferente en ciertos casos. Para garantizar un orden determinista de ejecución, introducimos filtros condicionales en estas variables para aplicar la secuencia de acción adecuada. El agente lee el valor de la variable "Pasos de resolución" y define dos filtros en función de si esta variable tiene un valor o no.

La acción "Pasos de resolución de problemas" solo se puede ejecutar si la variable "Pasos de resolución" está vacía.
La acción "Utilizar en medio de la resolución de un problema" solo se puede ejecutar si se completa la variable "Pasos de resolución".

Estos filtros condicionales ahora aplican de forma determinista la secuencia de ejecución de la acción: "Utilizar en medio de la resolución de un problema" debe esperar a que "Pasos de resolución de problemas" complete su tarea, lo que garantiza que la variable "Pasos de resolución" siempre tenga un valor.

Para garantizar la ejecución correcta de la acción, se necesita una tercera acción para restablecer la variable "Pasos de resolución" si el problema se resuelve por completo. Como resultado, el agente se restablece al estado requerido para ayudar con un posible problema nuevo y diferente. Esta tercera acción se llama "Vaciar la variable de resolución". El diagrama de acciones completo se muestra a continuación.

Gráfico de diagrama de flujo que muestra un agente que utiliza filtros para solucionar problemas o proporcionar soluciones.

Las variables son fundamentales para que nuestro agente de resolución de problemas pueda resolver los problemas de los clientes, ya que permiten:

Fundamentación dinámica persistente: las variables almacenan los pasos para solucionar problemas, lo que garantiza que estén disponibles durante toda la conversación, independientemente de la duración o el número de interacciones. Esto evita que el agente olvide el contexto.
Flujo de datos: las variables facilitan el flujo de datos entre acciones. Por ejemplo, la variable "Pasos de resolución" almacena los pasos de resolución de problemas recuperados de la acción "Pasos de resolución de problemas" y los proporciona como entrada a la acción "Utilizar en medio de la resolución de un problema".
Determinismo: las variables se pueden usar como filtros para aplicar un orden específico de ejecución de acciones. Por ejemplo, la acción "Utilizar en medio de la resolución de un problema" solo se ejecuta si se completa la variable "Paso de resolución", con lo que se garantiza que la acción "Pasos de resolución de problemas" se ejecute primero.

Variables para mantener los resultados del modelo predictivo

En la era de la IA generativa, la IA predictiva sigue siendo de vital importancia, ya que constituye la inteligencia fundamental que guía, mejora y contextualiza las capacidades generativas. Mientras que la IA generativa se centra en crear contenido nuevo, como texto, imágenes o vídeos, los modelos predictivos hacen predicciones sobre el futuro basándose en datos empresariales en tiempo real. Algunos ejemplos de resultados empresariales son las probabilidades de pérdida de clientes, las probabilidades de conversión, las probabilidades de derivación de casos, el valor vitalicio de los clientes y la clasificación de casos. Las predicciones pueden ayudar a anticipar las necesidades de los usuarios, personalizar los resultados, tomar decisiones y optimizar la relevancia del contenido en tiempo real, todo ello mediante el análisis de tendencias y cifras. Por ejemplo, en aplicaciones como el aprendizaje personalizado, la asistencia sanitaria o la planificación financiera, la IA predictiva garantiza que los resultados generativos se ajusten a los contextos individuales y a los posibles escenarios futuros. Juntas, la IA predictiva y generativa crean una potente sinergia, en la que se fusionan la previsión y la creatividad para impulsar soluciones tecnológicas más inteligentes, adaptables y con mayor impacto.

Cómo integrar los resultados de los modelos predictivos en los flujos de trabajo de los agentes

Para incorporar los resultados de los modelos predictivos a los flujos de trabajo de los agentes, simplemente basta con añadir acciones de modelos predictivos a los activos de Agentforce. El Generador de modelos proporciona los medios para crear o registrar (BYO) modelos predictivos, que luego son utilizados por el agente para realizar predicciones. Las predicciones resultantes (así como los predictores) se pueden almacenar en variables personalizadas. Los agentes pueden utilizar estos valores variables como entradas y condicionar la ejecución de acciones y temas específicos.

Ejemplos de casos de uso integrados con modelos predictivos

Segmentación: realiza una clasificación multiclase para la segmentación de clientes y utiliza el segmento resultante para filtrar determinadas acciones. Por ejemplo, reserva acciones premium para clientes de nivel premium.
Probabilidad de derivación: predice la probabilidad de derivación de un caso de servicio. Si esta probabilidad supera un cierto umbral, permite la ejecución de acciones que resuelvan el caso más rápido o derívalo a agentes humanos más rápido.
CPG: planifica una promoción solo si el aumento de las ventas (puntuación calculada por un modelo predictivo) supera un determinado umbral.
Comercio: propón un producto solo si la inclinación a comprar supera un cierto umbral.

Control agéntico de nivel cinco: acciones deterministas

Ciertos procesos empresariales deben ejecutarse en un orden preciso y no requieren la intervención del usuario durante su ejecución. En este caso, se puede aplicar un flujo de pasos predeterminado mediante flujos, API o Apex. Si tiene un flujo existente en el que se basa la producción, es una buena indicación de que el agente puede conservarlo y utilizarlo para la ejecución de ese proceso empresarial. Todos los ejemplos siguientes incluyen secuencias predeterminadas de pasos que el agente puede ejecutar sin necesidad de intervención del usuario. El comportamiento agéntico en este caso consiste en identificar qué proceso determinista ejecutar, cómo recopilar los datos necesarios y cómo interpretar y procesar los resultados.

Los procesos empresariales con muchos pasos secuenciales (más de tres, como regla general) y muchas dependencias de variables se vuelven demasiado complejos y engorrosos de aplicar con instrucciones. En este caso, es posible codificarlos directamente utilizando los tipos de acción deterministas que se enumeran en esta sección. Por último, tenga en cuenta que estas implementaciones pueden incluir elementos no deterministas, como llamar a LLM con plantillas de solicitud resueltas. Por lo tanto, no necesariamente son completamente deterministas de principio a fin, y aún así pueden demostrar los niveles de fluidez deseados por los que los agentes son conocidos.

Gráfico de diagrama de flujo que muestra un recorrido de marketing.

La secuencia de pasos en un recorrido de marketing está condicionada por reglas fijas y no depende de ninguna entrada conversacional del usuario. Por lo tanto, el flujo se puede utilizar como una acción de Agentforce. Se puede crear una acción invocable para completar tareas en segundo plano o activadas por eventos desde un componente de solución que puede llamar a un flujo o a una clase Apex. Añada una acción invocable a un flujo o clase Apex y especifique la tarea que debe completar el agente, así como las condiciones que lo activan. Las acciones invocables también pueden incluir las variables de contexto del agente y transmitir información importante.

Flujos

Los flujos de Salesforce se pueden utilizar para automatizar tareas rutinarias, como crear tareas de seguimiento, enviar correos electrónicos de recordatorio o actualizar registros. Los flujos hacen que el trabajo sea más eficiente y productivo. Los agentes también pueden ejecutar flujos mediante acciones de flujo. Debido a su determinismo, los flujos son una excelente manera de dirigir el comportamiento agéntico cuando un proceso empresarial debe ejecutarse en una secuencia particular. Una buena indicación de que es preferible una acción de flujo es si el tema contiene instrucciones como "Primero haz esto, luego haz esto y, por último, haz esto". Hacer cumplir secuencias de más de tres pasos resulta complicado de gestionar mediante instrucciones y variables.

Los flujos también pueden incluir elementos no deterministas mediante llamadas a las solicitudes. Un nodo de solicitud en el flujo invoca una plantilla de solicitud y recopila la respuesta que se puede pasar a otros elementos del flujo. Estos elementos adicionales pueden ser nuevamente nodos de solicitud, por ejemplo, resumiendo la respuesta anterior, creando así una cadena de solicitudes. Esto resulta especialmente útil cuando las reglas del encadenado de solicitudes se definen mediante elementos fijos y no dependen de la entrada del usuario. Un ejemplo es la RAG agéntica, en la que una secuencia predefinida de recuperadores o solicitudes en un flujo puede acceder a fuentes de datos específicas en un orden concreto, como recuperar inicialmente datos del documento del país de un usuario antes de consultar otras fuentes según sea necesario. Este mecanismo de encadenado impone una extracción fiable y ordenada de información relevante.

Acciones de Apex y API

Al igual que las acciones de flujos, las acciones de Apex y API son deterministas, ya que se puede codificar una secuencia predefinida de acciones. Estas acciones pueden incluir elementos no deterministas, como invocar plantillas de solicitud o llamadas al LLM. Sin embargo, en su definición, ejecutan estos pasos de forma determinista, lo que reduce la variabilidad del agente al llamar a la acción en el momento adecuado, recopilar la información necesaria y procesar el resultado. Estas responsabilidades aún deben regirse por instrucciones agénticas, por lo que no son deterministas. Las acciones de Apex y API son el equivalente en código profesional de las acciones de flujo.

Resumen de métodos para lograr el determinismo guiado

Para lograr un comportamiento fiable de los agentes, es necesario adoptar un enfoque estructurado que equilibre la flexibilidad inherente a los modelos de lenguaje grandes (LLM) con la necesidad de control y previsibilidad a nivel empresarial. Este artículo describe una estrategia por capas para implementar el "determinismo guiado", que permite crear agentes que no solo son inteligentes y autónomos, sino que también son precisos y están alineados con los procesos empresariales de forma sistemática. La clave para desarrollar estos agentes de confianza reside en la implementación progresiva de mecanismos de control, cada uno de los cuales añade una nueva capa de fiabilidad:

Diseño de temas y acciones fundamentales: el proceso comienza con la organización cuidadosa de las capacidades de un agente en distintos temas y acciones granulares. Al crear agrupaciones semánticamente distintas y lógicas, reducimos el riesgo de confundir al motor de razonamiento y que seleccione la acción incorrecta, lo que sienta las bases para un comportamiento predecible.
Instrucciones explícitas: sobre esta base, las instrucciones del agente proporcionan el siguiente nivel de control. Estas instrucciones actúan como salvaguardas y directrices, y orientan al motor de razonamiento sobre cómo ejecutar acciones dentro de su ámbito, adherirse a las políticas de la empresa y gestionar el flujo de la conversación sin acotar en exceso la interacción.
Fundamentación de datos con RAG: para mejorar las respuestas con hechos y relevancia, la fundamentación en datos conecta al agente con fuentes de conocimiento verificadas. Enfoques como la generación aumentada por recuperación (RAG) permiten a los agentes obtener información precisa en tiempo real de artículos de conocimiento y datos de la empresa, lo que minimiza la especulación y mejora la fiabilidad.
Gestión de contexto y estado con variables: para interacciones más complejas y con estado, las variables introducen una forma de memoria a corto plazo. Permiten al agente conservar el contexto, preservar datos importantes a lo largo de una conversación y aplicar una secuencia determinista de operaciones condicionando la ejecución de las acciones al estado de una variable.
Ejecución determinista con flujos, Apex y API: en el caso de procesos empresariales que exigen una ejecución rígida e invariable, el nivel más alto de control se logra a través de acciones deterministas. Al integrar agentes con los flujos de Salesforce, Apex y API, se pueden ejecutar secuencias predefinidas con precisión, con lo que se elimina la dependencia de la intervención del usuario o del LLM en pasos críticos.

Mediante la aplicación sistemática de estas capas de control (desde un diseño cuidadoso y unas instrucciones claras hasta la fundamentación de los datos, la gestión del estado y la automatización determinista de los procesos), los desarrolladores pueden superar con éxito los retos que plantea la creación de agentes fiables con resultados empresariales coherentes. Este enfoque estratégico garantiza que se pueda confiar en los agentes de Agentforce para realizar funciones críticas para el negocio con la precisión y coherencia requeridas en el ámbito empresarial.

Preguntas frecuentes sobre el determinismo en la IA

Los cinco niveles de determinismo en la IA son: selección de temas y acciones sin instrucciones, instrucciones del agente, fundamentación en datos, variables de agente y acciones deterministas utilizando flujos, Apex y API.

Comprender el determinismo en la IA es crucial para crear agentes fiables que puedan realizar funciones empresariales importantes de forma precisa y coherente, y lograr así un equilibrio entre la fluidez creativa y el control empresarial.

En el campo de la IA, "determinista" se refiere a la capacidad de un sistema para producir la misma salida con la misma entrada y condiciones; es decir, se impone un nivel de rigidez y disciplina esencial para lograr un comportamiento fiable de los agentes.

El no determinismo en los sistemas de IA surge principalmente debido al uso de modelos de lenguaje grandes (LLM), que no son deterministas por naturaleza, lo que permite a los agentes ser flexibles y adaptativos.

Los niveles de determinismo aumentan progresivamente el determinismo de los agentes de IA, lo que afecta a su autonomía. A medida que el nivel sube, el agente se vuelve menos autónomo, pero más fiable y alineado con los procesos empresariales.

Los sistemas de IA menos deterministas presentan desafíos en términos de fiabilidad y cumplimiento de los requisitos empresariales, ya que su falta de determinismo inherente puede conducir a comportamientos impredecibles.

Las empresas que tienen sistemas de IA con diferentes niveles de determinismo los gestionan a través de un enfoque por capas que incluye un diseño cuidadoso, instrucciones claras, fundamentación en datos, gestión de estados mediante variables y automatización de procesos deterministas utilizando flujos, Apex y API.

Obtenga más información sobre los agentes IA y cómo pueden ayudar a su empresa.

Guía

¿Todo listo para dar el siguiente paso con Agentforce?

Cree agentes IA rápidamente.

Conozca en detalle cómo funciona la creación de agentes en nuestra biblioteca de recursos.

Ver demos

Obtenga orientación experta.

Lance Agentforce rápidamente, con confianza y consiga un ROI que pueda medir.

Descubra cómo

Hable con un representante.

Cuéntenos las necesidades de su negocio y le ayudaremos a encontrar respuestas.

Contacte con nosotros

Agentforce

Sales

Service

Marketing

Ecommerce

Analytics

Slack

Net Zero

Pymes

Data

Agentforce 360 Platform

Customer Success

Partner Apps

Descubra el CRM de IA n.º 1

Descubra el CRM de IA n.º 1

Automoción

Telco

Ingeniería, Construcción e Inmobiliario

Bienes de consumo

Educación

Energía y recursos

Servicios financieros

Sanidad y Ciencias de la Salud

Fabricación

Medios de comunicación

Organizaciones sin ánimo de lucro

Servicios profesionales

Sector público

Retail

Tecnología

Viaje, transporte y hostelería

Explore Salesforce según la industria.

Explore Salesforce según la industria.

Historias de clientes

Historias de Trailblazer

Explore las historias de éxito.

Explore las historias de éxito.

Dreamforce

TDX

Conexiones

Tableau Conference

Cumbre de Educación

Agentforce World Tours

Salesforce+

Más eventos de Salesforce

Eventos de Salesforce

Eventos de Salesforce

Aprenda con Trailhead

Eventos y experiencias

El Blog 360

Por tema

Por puesto

Por sector

Por tipo de contenido

Centro de éxito

Conviértase en un Trailblazer.

Conviértase en un Trailblazer.

Ayuda y documentación

Servicios y planes

¿Tiene alguna pregunta? Podemos ayudarle.

¿Tiene alguna pregunta? Podemos ayudarle.

Acerca de Salesforce

Nuestro impacto

Empleo

Noticias

Conozca nuestra historia.

Conozca nuestra historia.

Contáctenos

Llámenos

En línea

Cambiar región

América

Europa, Oriente Medio y África

Asia Pacífico

Cambiar región

América

Europa, Oriente Medio y África

Asia Pacífico

Cambiar región

América