Vad är stora åtgärdsmodeller (LAM:er)?
När man kombinerar den språkliga flytande förmågan hos en LLM med förmågan att utföra uppgifter och fatta beslut självständigt, upphöjs generativ AI till en aktiv partner i att få arbete gjort.
Silvio Savarese
När man kombinerar den språkliga flytande förmågan hos en LLM med förmågan att utföra uppgifter och fatta beslut självständigt, upphöjs generativ AI till en aktiv partner i att få arbete gjort.
Silvio Savarese
Jag tror att stora åtgärdsmodeller (LAM:er) representerar ett lika stort skifte i utvecklingen av AI som något vi har sett under det föregående decenniet. Precis som LLM:er gjort det möjligt att automatisera genereringen av text, och i sina multimodala former, ett brett spektrum av medier, kan LAM:er snart göra det möjligt att automatisera hela processer. Och eftersom de är naturligt flytande i språk, kommer de att interagera intelligent med världen – kommunicera med människor, anpassa sig när omständigheterna förändras och till och med interagera med andra LAM:er.
De senaste månaderna har en kraftfull ny trend uppstått där stora språkmodeller utökas till att bli "agenter" – programvaruenheter som kan utföra uppgifter på egen hand, i slutändan i ett måls tjänst, snarare än att bara svara på frågor från mänskliga användare. Det kan verka som en enkel förändring, men den öppnar upp ett helt universum av nya möjligheter – genom att kombinera det språkliga flyt hos en LLM med förmågan att utföra uppgifter och fatta beslut självständigt, lyfts generativ AI från ett passivt verktyg, hur kraftfullt det än må vara, till en aktiv partner för att få arbete gjort i realtid. Här på Salesforce AI har potentialen hos sådana kraftfulla agenter varit ett ämne för aktiv forskning➚ och utveckling under en tid.
Få kontakt med Agentblazers från hela världen och lär dig mer om AI, utforska användningsfall, lyssna på produktexperter och mycket mer. Stärk din AI-expertis – och din karriär.
Enkelt uttryckt är en storskalig åtgärdsmodell (LAM) en typ av generativ AI som kan utföra specifika åtgärder baserat på användarfrågor. Dessa modeller analyserar inte bara data, utan är utformade för att vidta åtgärder baserat på resultaten. Tänk på dem som den positiva kusinen till en stor språkmodell (LLM). En LLM kan generera text som svar på en fråga, medan en LAM vidtar åtgärder➚ – som att hjälpa en kund att behandla en retur.
Jag tror att ett viktigt mandat för AI är strävan efter automatisering som förstärker mänskliga förmågor, snarare än att försöka ersätta dem. Med det i åtanke bör LAM:er fokusera på att ta över repetitiva uppgifter och annat stressigt arbete – den typ av saker de flesta av oss inte vill göra från första början – som står i vägen för den typ av meningsfulla, värdefulla strävanden som vi är bäst på. Så låt oss diskutera den otroliga potential som LAM:er lovar på två nivåer: för individer och för organisationer. Låt oss under processens gång föreställa oss hur LAM:er kan tillämpas idag , och hur deras roll i vårt arbete och våra liv kan utvecklas under de kommande åren.
Personliga assistenter har varit en lyx reserverad för de rika i generationer, även om teknikbranschen har lovat virtuella alternativ för massorna i årtionden också. LAM:er, med sitt häpnadsväckande flyt och sin förmåga att generalisera naturligt över praktiskt taget alla livets områden, kan vara vändpunkten vi har väntat på – en teknik som verkligen kan hjälpa oss, med mycket av den framsynthet och skärpa vi förväntar oss av en mänsklig kollega. Tänk på följande:
Det har varit mycket uppståndelse på sistone om vilken inverkan LLM:er har på marknadsföringsarbetsflöden, där deras förmåga att generera text, bilder och till och med webblayouter ses som en viktig förändring för fältet. Saken är dock mer komplicerad i praktiken, eftersom det krävs en stor manuell ansträngning för att integrera ett LLM-resultat i hela processen med att till exempel utforma en ny kampanj och lansera resultaten. För närvarande automatiserar även den bästa generativa AI:n bara selektiva delar av den processen.
Vi föreställer oss att AI-agenter för marknadsföring emellertid kommer att ha en bredare, mer LAM-liknande strategi för att leverera resultat för marknadsföringsteam, genom att använda ett LLM-gränssnitt för att koppla samman data, verktyg och domänspecifika agenter i strävan efter en övergripande uppgift. Tänk dig till exempel en förfrågan som denna:
"Skicka ett marknadsföringsmejl för att lyfta fram värdet i vår nya Chocho Choklad. Ge de första 100 personerna som köper en kupong för fri frakt. Se till att varje mottagare får ett personligt meddelande."
På egen hand skulle en LLM ha svårt att uppfylla den. En konstellation av verktyg, agenter och datakällor – tillgång till tidigare marknadsföringsmaterial, kunddata som organisationen har valt att dela med LAM, och naturligtvis även LLM:erna själva – skulle kunna generera texten ("Skicka ett marknadsföringsmejl") från dokumentation som lyfter fram de senaste produktutvecklingarna ("värdet i vår nya Choco Chocolate"), bryta ner logiken bakom förfrågan ("Ge de första 100 personerna som köper en kupong") och hantera kundspecifika detaljer ("Se till att varje mottagare får ett personligt meddelande") med lätthet.
Men personliga assistenter är avsedda att hjälpa till under hela livet, inte bara i arbetet. Så låt oss föreställa oss hur de kan hjälpa till med ett viktigt men personligt köpbeslut, som en bil. För många kan processen att köpa ett fordon vara mer krångel än spänning, och särskilt researchfasen kan vara överväldigande. Med en LAM kan det dock snart inte krävas lite mer än en prompt som följande:
Jag letar efter en sedan med bra säkerhetsbetyg och gott om utrymme, helst i en mörk färg. Tidigast 2014, men inte dyrare än 28 000 dollar. Och körsträckan under 90 000.
Det första steget, för både en människa och en LAM, skulle vara att skanna bilköpswebbplatser för att sammanställa en första lista med alternativ. En LLM:s kraftfulla textförståelse gör det möjligt för agenten att läsa enorma mängder bilrecensioner från både professionella och användargenererade källor, och snabbt identifiera kandidater som uppfyller användarens kriterier. Dessutom kan LAM lägga märke till varningssignaler – till exempel upptäckt att en viss årsmodell av en annars lämplig bilmodell är ökänd för felaktiga växellådor eller elektriska problem, och tar bort den från listan (eller åtminstone kommenterar den med en ansvarsfriskrivning).
Som ett nästa steg skulle LAM:en till och med kunna inleda samtal med privata säljare och lokala återförsäljare, med hjälp av kanaler som e-post eller till och med SMS för att nå ut. Även om en bra LAM sannolikt skulle tillkännage att den är en AI, vilket säkerställer att människor aldrig blir vilseledda, skulle den fortfarande kommunicera på ett tydligt, flytande och naturligt språk, med hälsningar, fullständiga meningar och en tydlig begäran eller ett uttalande i varje meddelande. Användarens bank kan till och med bli underrättad och informerad om att ett låneutkast bör skapas. När konversationen närmar sig beslutsfattandet kan användaren kopplas in för slutgiltigt godkännande.
I slutändan är Salesforce AI engagerat i att använda teknikens kraft för att förbättra hur företag arbetar i alla skalor, och LAM:er är ett bra exempel på hur det kan se ut under de kommande åren. Jag är övertygad om att den här visionen kommer att nå ut till alla aspekter av verksamheten, från backoffice till marknadsföringens frontlinje – inklusive applikationer vi inte ens kan föreställa oss än – men det finns förmodligen inget bättre enskilt exempel än att interagera med kunder.
Tänk dig till exempel en agent på ett försäkringsbolag. En stor del av den agentens dag kommer att bestå av att träffa kunder, både befintliga och potentiella, för att diskutera deras behov och utveckla relationen. Kärnan i denna process är den mänskliga kontakten som bara en agent av kött och blod kan leverera, men agenten är omgärdad av repetitiva uppgifter som en LAM skulle kunna påskynda dramatiskt. Betrakta följande flöde som utökas från ett steg till nästa av generativ AI:
Jag tycker att detta är en övertygande vision om individuell egenmakt, men den verkliga omvandlingen kommer tack vare skalbarheten hos LAM:er. Tänk dig ett helt företag som utökar sin personal med så sofistikerade verktyg, och hur mycket tid och pengar som kan sparas totalt sett – för att inte tala om hur LAM-förslag kan hjälpa till att förhindra misstag, rekommendera framgångsrika strategier och mer. Detta är en teknik som verkligen kan leverera värde oavsett implementeringsskala.
Hittills har vi pratat om LAM:er som betjänar enskilda användare, men det finns många, många fler former som den här tekniken sannolikt kommer att ta. Det är lika lätt att föreställa sig LAM:er som betjänar grupper eller till och med hela organisationer. Och även om alla LAM:er kommer att dra nytta av sin flexibilitet, förväntar jag mig en mängd olika möjligheter, från det mycket generella – liknande de ”verkställande assistent”-koncept som beskrivs ovan – till väldigt skräddarsydda, domänspecifika agenter som tar itu med nischproblem. Och många LAM:er – alla så småningom – kommer att utformas för att lära av sina erfarenheter, oavsett om det handlar om att samla mer och mer expertis för att lösa ett organisatoriskt problem eller att bli alltmer anpassade till enskilda användares behov och preferenser.
Och vem säger att LAM:er kommer att fungera individuellt? Man kan lika gärna föreställa sig flera LAM:er som arbetar tillsammans, var och en optimerad för en annan uppsättning mål, med en annan LAM dedikerad till uppgiften att samordna sina ansträngningar och kommunicera med sin eller sina användare, vare sig det är en individ, ett team eller till och med en hel organisation. Med andra ord skulle det innebära en uppgradering från en enda personlig assistent till ett helt team, allt förenat av en "stabschef" som rapporterar till den ansvariga människan.
Möjligheterna blir ännu mer intressanta när vi betraktar LAM:er som skapats enbart i syfte att interagera med andra LAM:er eller team av LAM:er. Tänk dig till exempel en agent som anlitas av en av bilhandlarna i exemplet ovan och som specialiserar sig på att hantera inkommande förfrågningar från de personliga LAM:er som representerar potentiella kunder, eller itererar med de LAM:er som representerar biltillverkarna själva. De skulle behålla den transparens och allmänna tillämpning som gör alla LAM:er värdefulla, särskilt när man utvärderar deras beteende i efterhand, men fungera med de mycket högre hastigheter och effektiviteter som maskin-till-maskin-kommunikation möjliggör.
Ta reda på hur mycket tid och pengar du kan spara med ett team av AI-drivna agenter som arbetar sida vid sida med dina medarbetare och övrig personal. Svara på några enkla frågor för att se vad som är möjligt med Agentforce.
Även om många tekniska hinder ligger framför oss för att förverkliga LAM:ernas fulla kraft, är den centrala utmaningen enkel att formulera: världen är inte en statisk plats, och alla agenter som är avsedda att interagera med den måste vara tillräckligt flexibla för att anpassa sig smidigt till förändrade omständigheter. När det gäller vårt exempel på bilköp innebär det att hålla koll på leads och inse när en attraktiv bil har sålts innan användaren har haft chans att lägga ett bud, eller till och med uppdatera sina förslag i händelse av att en återkallelse utfärdas mitt i researchprocessen. När det gäller vårt exempel med försäkringsbyrån är det viktigt att vara medveten om aktuella händelser – särskilt de som är lokala för kunden – för att kunna tillhandahålla användbar och aktuell information, allt från förändringar i branschregleringar till extrema väderhändelser.
I samtliga fall kommer en bra LAM att definiera sig själv genom sin förståelse för när den ska meddela sin mänskliga användare eller begära förtydliganden. Att göra det för ofta kommer att vara irriterande och störande, och kan till och med upphäva fördelarna med en LAM från början. Att göra det för sällan garanterar dock nästan att potentiellt allvarliga, oönskade biverkningar frodas, allt från att radera ett viktigt e-postmeddelande till att begära ett oönskat lån från användarens egen bank. Precis som en bra personlig assistent behöver en LAM goda instinkter för att hitta rätt balans.
Det innebär också att utnyttja en av de mest kraftfulla funktionerna hos LAM:er, nämligen deras förmåga att lära sig. I takt med att LAM:er exponeras för mer och mer verklig erfarenhet av att arbeta tillsammans med oss, kan mänsklig feedback användas för att ytterligare förfina deras beteende. Dessutom kan LAM:er extrahera värdefulla tolkningar av flöden och processer genom att granska data som sträcker sig från kundtjänsttranskriptioner till händelseloggar, och sammanställa de ideala stegen som kopplar en given startpunkt till det mest önskvärda resultatet.
För att vara tydlig, en LAM:s jobb handlar inte bara om att omvandla en förfrågan till en serie steg, utan att förstå logiken som kopplar samman och omger dem. Det innebär att förstå varför ett steg måste ske före eller efter ett annat, och att veta när det är dags att ändra planen för att tillgodose förändrade omständigheter. Det är en förmåga vi visar upp hela tiden i vardagen. Till exempel, när vi inte har tillräckligt med ägg för att göra en omelett, vet vi att det första steget inte har något att göra med matlagning, utan med att gå till närmaste mataffär. Det är dags att vi bygger teknik som kan göra detsamma.
Det råder ingen tvekan om att LAM:er kommer att bli kusligt bra på den typ av flyt och kommunikation som många av exemplen ovan skulle kräva. Men det är fortfarande inte givet att de kan litas på att bete sig på förutsägbara, effektiva sätt med den konsekvens som krävs för regelbunden användning i den verkliga världen.
Naturligtvis, om förtroende redan är en utmaning när det gäller att generera text och bilder – och det är det verkligen – är det en ännu större utmaning när det gäller att vidta åtgärder. Och bördan av att säkerställa säkerhet och tillförlitlighet bara växer när flera LAM:er samarbetar. Av denna anledning anser jag att det är viktigt att även i sina mest oberoende lägen är LAM:er utformade för att hålla människor uppdaterade innan kritiska åtgärder vidtas. Oavsett hur avancerad den här tekniken blir ser jag den som ett verktyg – om än ovanligt intelligent – och ett som människor alltid kan kontrollera som de tycker passar.
Låt autonoma AI-agenter förändra arbetssättet i alla roller, arbetsflöden och branscher.
Efter ett decennium av AI-utveckling som inte har varit något annat än historisk, är det ett bevis på potentialen hos LAM:er att så många av oss i forskarvärlden känner att de största förändringarna bara börjar synas. Med rätt vägledning och ett engagemang för mänsklig egenmakt tror jag att LAM:er kan inleda en ny era av produktivitet, enkelhet och tydlighet, vilket gör oss bättre på de uppgifter vi tycker är mest engagerande samtidigt som vi frigör oss från de vi inte gör. Och med sina årtionden av historia inom företagsvärlden kan jag inte tänka mig en bättre plats att följa denna vision än Salesforce.
Ett särskilt tack till Alex Michael, Peter Schwartz och Salesforce Futures-teamet för deras bidrag till skrivandet av den här artikeln.
Titta närmare på hur det går till att bygga agenter i vårt bibliotek.
Lansera Agentforce med hastighet, förtroende och ROI som du kan mäta.
Berätta vad du behöver så hjälper vi dig vidare.