Skip to Content
Passer au pied de page
0%

Salesforce AI Research fait progresser l’IA agentique et propose aux entreprises des environnements de simulations, des outils de mesure d’agents IA et la consolidation des données dupliquées

ai research

Ce trimestre, Salesforce AI Research a dévoilé un environnement de simulation d’entreprise pour tester la capacité des agents à agir dans des scénarios d’usage réalistes. L’équipe a également soutenu le lancement d’un nouvel outil de benchmarking pour mesurer les agents dans les cas d’usage en entreprise. Enfin, Data Cloud a été amélioré avec des capacités évoluées de consolidation exploitant des modèles de langage petits et grands pour unifier les données de manière autonome.

De l’amélioration de la qualité des données à la définition de nouveaux standards pour mesurer la performance agentique, ces innovations alimentent des avancées produit qui répondent aux défis les plus pressants des CIO et des responsables IT. Elles donnent aux entreprises la confiance et les outils nécessaires pour évoluer vers des entreprises agentiques, des organisations qui adoptent le travail numérique et utilisent l’IA pour travailler aux côtés des humains.

Simuler les environnements d’entreprise avec CRMArena-Pro

Les pilotes n’apprennent pas à voler en pleine tempête ; ils s’entraînent dans des simulateurs de vol qui les préparent aux situations les plus extrêmes. De la même façon, les chirurgiens testent leurs compétences sur des modèles synthétiques avant d’opérer un être humain et les athlètes perfectionnent leurs tactiques lors d’exercices et de matchs d’entraînement avant une grande compétition. Dans tous les domaines à forts enjeux, les compétences et la rigueur se développent non pas dans l’action réelle, mais grâce à une préparation méthodique dans un espace où l’échec devient un outil d’apprentissage plutôt qu’une erreur coûteuse.

De la même manière, les agents IA bénéficient de tests et d’entraînements en simulation, les préparant à gérer l’imprévisibilité des scénarios quotidiens avant leur déploiement. En s’appuyant sur la version originale de CRMArena, qui se concentrait sur des tâches de service B2C à un seul échange, Salesforce AI Research a désormais dévoilé CRMArena-Pro, qui évalue la performance des agents dans des scénarios complexes, multi-échanges et multi-agents, tels que la prévision des ventes, le triage des cas de service ou encore les processus CPQ. En utilisant des données synthétiques, en autorisant des appels API sécurisés vers les systèmes pertinents et en appliquant des garde-fous stricts pour protéger les informations personnelles, CRMArena-Pro crée un cadre rigoureux et riche en contexte de simulation d’entreprise, permettant de tester non seulement si un agent fonctionne, mais aussi s’il peut opérer avec précision, efficacité et constance à grande échelle dans des cas d’usage propres à l’entreprise.

Agissant presque comme un jumeau numérique ou un métavers d’entreprise, ces environnements vont au-delà de simples bancs d’essai en capturant toute la complexité des opérations d’entreprise. Salesforce AI Research fait progresser la formation des agents d’IA grâce à ces simulations, permettant aux entreprises de tester les agents dans des situations telles que les cas complexes de service client ou les perturbations de la chaîne d’approvisionnement, avant tout déploiement réel. En intégrant le « bruit » du monde réel, les entreprises peuvent mieux évaluer leurs performances, renforcer leur résilience face aux cas extrêmes et combler l’écart entre l’entraînement et les opérations réelles, donnant naissance à des agents d’IA non seulement performants, mais aussi cohérents, fiables et prêts pour l’entreprise agentique.

Mesurer la préparation des agents avec l’ Agentic Benchmark for CRM (référentiel agentique pour la gestion de la relation client)

Avec l’émergence quotidienne de nouveaux modèles et mises à jour, les entreprises font face à un dilemme croissant : déterminer quel modèle, ou quelle combinaison de modèles, est le mieux adapté pour alimenter les agents dans des environnements métier réels. La réponse ne peut pas venir des effets de mode ni de la taille brute des modèles ; elle exige une méthode rigoureuse pour mesurer la performance des agents au sein de workflows métier spécifiques.

Pour répondre aux exigences uniques des environnements de simulation d’entreprise, Salesforce  lance  l’Agentic Benchmark for CRM, le premier outil de benchmarking conçu pour évaluer les agents IA non pas sur des capacités génériques, mais dans des contextes réellement importants pour les entreprises, notamment le service client, le service sur le terrain, le marketing et les ventes. Le benchmark mesure les agents selon cinq indicateurs essentiels pour l’entreprise — précision, coût, rapidité, confiance et sécurité, et durabilité — offrant une évaluation complète et basée sur les données de leur préparation au déploiement réel.

La durabilité, nouvel indicateur du dispositif de mesure des agents, devient un critère clé de leur préparation à l’entreprise. Cet indicateur met en lumière l’impact environnemental relatif des systèmes d’IA, dont certains nécessitent d’importantes ressources de calcul. En ajustant la taille des modèles au niveau d’intelligence réellement requis pour accomplir une tâche spécifique à l’entreprise, les organisations peuvent réduire leur empreinte et évaluer la durabilité de leur IA, tout en obtenant la performance attendue. En évitant la surenchère de modèles, ce référentiel offre aux entreprises un moyen clair et fondé sur les données d’associer les bons modèles aux bons agents, garantissant une performance constante, fiable et adaptée aux standards de l’entreprise.

MCP-Eval et MCP-Universe sont deux nouveaux référentiels complémentaires publiés ce trimestre par Salesforce AI Research pour évaluer les agents à différents niveaux de rigueur, en suivant la façon dont les LLM interagissent avec les serveurs MCP dans des environnements proches des cas d’usage réels.

MCP-Eval propose une évaluation automatique et évolutive à travers des tâches synthétiques, ce qui en fait un outil adapté pour tester un large éventail de serveurs MCP. MCP-Universe, quant à lui, introduit des tâches réalistes et exigeantes avec des évaluateurs basés sur l’exécution, afin de soumettre les agents à des scénarios complexes, tout en offrant un cadre extensible pour concevoir et évaluer de nouveaux agents.

Ensemble, ils forment une boîte à outils puissante : MCP-Eval pour des évaluations larges et initiales, et MCP-Universe pour un diagnostic et un débogage plus poussés.

Cette approche en deux volets est particulièrement essentielle pour les entreprises, car la recherche a montré que la plupart des LLM les plus avancés du marché présentent encore des limites qui freinent leur adoption à l’échelle entreprise — qu’il s’agisse des défis liés aux longs contextes, où les modèles perdent le fil des informations dans des entrées complexes, ou des défis liés aux outils inconnus, où ils peinent à s’adapter sans heurts à de nouveaux systèmes.

En s’appuyant sur MCP-Universe et MCP-Eval, les entreprises obtiennent une vision claire des points de défaillance des agents et peuvent affiner leurs cadres ou intégrer leurs outils de manière plus efficace. Avec une plateforme qui renforce le contexte, améliore les capacités de raisonnement et intègre des garde-fous de confiance, les organisations peuvent dépasser la simple expérimentation artisanale pour déployer des agents réellement prêts à générer un impact concret dans leurs activités.

Consolider les données avec Account Matching

Au cœur d’une performance fiable et évolutive des agents IA se trouvent des données unifiées et de haute qualité, permettant des décisions précises et conformes. Des données unifiées permettent aux agents de comprendre le contexte, de suivre les règles d’entreprise et de prendre des décisions alignées sur les objectifs organisationnels. Cependant, cela a longtemps été un défi pour les entreprises, car les données d’entreprise sont rarement “propres” ou bien organisées. Les dossiers clients sont souvent dupliqués entre départements, les champs sont incomplets et les formats ou conventions de nommage inconsistants rendent difficile la réconciliation des données entre systèmes.

Pour y remédier, les équipes Salesforce AI Research et produit ont collaboré pour affiner des modèles de langage grands et petits et alimenter Account Matching, une fonctionnalité qui identifie et unifie de manière autonome les comptes à travers des ensembles de données dispersés et incohérents. Au lieu de traiter “The Example Company, Inc.” et “Example Co.” comme des entités distinctes, le système peut désormais utiliser l’IA pour les reconnaître comme étant la même entreprise et les consolider en un seul dossier officiel. Contrairement aux systèmes statiques fondés sur des règles, qui nécessitent une configuration manuelle lourde, Account Matching réconcilie des millions de dossiers en temps réel avec des améliorations mesurables de précision.

Ce sont précisément ces avancées qui génèrent aujourd’hui un véritable retour sur investissement pour les clients. Dès le premier mois d’utilisation, un outil propriétaire basé sur Account Matching a permis de réunifier plus d’un million de comptes avec un taux de correspondance réussi de 95 %, réduisant ainsi le temps moyen de traitement de 30 minutes.

Grâce à des modèles de langage, petits et grands, spécialement ajustés, et à des règles de rapprochement d’identité (nom du compte combiné à un site web, une adresse ou un numéro de téléphone), l’outil associe automatiquement les comptes entre différentes unités, propose un flux adapté pour que les commerciaux puissent se connecter, et n’oriente que les 5 % de cas les plus complexes vers des humains. En aidant les vendeurs à identifier rapidement leurs homologues traitant les mêmes comptes ou des comptes similaires, la solution supprime les doublons, accélère les cycles de vente et évite les opportunités manquées.

Mieux encore, l’ensemble a été déployé sans codage complexe, réduisant les coûts tout en améliorant considérablement l’efficacité. Avec Account Matching, les entreprises disposent de données propres et unifiées qui alimentent les agents d’IA en toute confiance, ouvrant la voie à une automatisation plus intelligente, une personnalisation enrichie et des décisions plus rapides à grande échelle.

À propos de Salesforce

Salesforce aide les organisations de toutes tailles à réinventer leur activité grâce à l’intelligence artificielle. Agentforce est la première solution de travail numérique pour entreprises qui s’intègre parfaitement aux applications CRM « Customer 360 », à « Data Cloud » et à « Einstein AI ». En réunissant humains et agents, Agentforce permet d’assurer le succès des clients sur une plateforme unique et de confiance. 

Pour plus d’informations

Pour en savoir plus sur les dernières avancées de Salesforce AI Research, rendez-vous sur SalesforceAIResearch.com.

À propos de Salesforce

Salesforce aide les organisations de toutes tailles à réinventer leur activité grâce à l'intelligence artificielle. Agentforce est la première solution de travail numérique pour entreprises qui s'intègre parfaitement aux applications CRM "Customer 360", à "Data Cloud" et à "Einstein AI". En réunissant humains et agents, Agentforce permet d'assurer le succès des clients sur une plateforme unique et de confiance.
Pour plus d'informations : Communiqués | Web |X| LinkedIn | YouTube