
什麼是大型行動模型 (LAM)?
當將大型語言模型 (LLM) 的語言流暢度與自主完成任務和決策的能力結合時,生成式 AI 即成為積極完成工作的夥伴。
Silvio Savarese
當將大型語言模型 (LLM) 的語言流暢度與自主完成任務和決策的能力結合時,生成式 AI 即成為積極完成工作的夥伴。
Silvio Savarese
我相信大型行動模型 (LAM) 在 AI 發展上代表著與過去十年所見任何突破相當的重大轉變。正如大型語言模型 (LLM) 讓文字生成自動化成為可能,並且在多模態形式下可涵蓋各類媒體,LAM 很快也可能實現整個流程的自動化。由於它們天生擅長語言,LAM 將能智慧地與世界互動 — 與人溝通、隨環境變化調整,甚至與其他 LAM 互動。
近幾個月來,一股強大的新趨勢崛起:大型語言模型被增強為「代理」 — 具備自主執行任務能力的軟體實體,最終以實現目標為服務,而非僅僅回應人類使用者的查詢。這看似簡單的改變,卻開啟了全新可能的宇宙 — 結合 LLM 的語言流暢度與自主完成任務及決策的能力,生成式 AI 從一個被動工具,無論多強大,都躍升為能即時協助完成工作的積極夥伴。在 Salesforce AI,我們已將這類強大代理的潛力視為積極研究➚ 與開發的主題已有一段時間。
簡而言之,大型動作模型 (LAM) 是一種生成式 AI 類型,可以根據使用者查詢執行特定操作。這些模型不僅分析數據,而且旨在根據發現採取行動。將它們視為大語言模型 (LLM) 的萬能表哥吧。LLM 可以生成文字來回應查詢,而 LAM 則採取行動 ➚ — 例如幫助購物者處理退貨。
我相信 AI 的重要任務是追求自動化來增強人類能力,而不是嘗試取代它們。考慮到這一點,LAM 應該專注於掌握重複性任務和其他忙碌的工作 — 這是我們大多數人最初不想做的事情 — 這會阻礙我們最擅長的有意義、高價值的努力。因此,讓我們在兩個層面討論令人難以置信的潛在 LAM 承諾:對於個人和組織。在這個過程中,讓我們想像如何在今天應用 LAM, 以及它們在我們的工作和生活中的角色可能在未來幾年中如何發展。
個人助理幾代以來一直是富人保有的奢侈品,儘管數十年來,科技行業也為大眾提供虛擬替代品。LAM 憑藉其驚人的流利性和在生活中幾乎所有領域的自然概括化能力,可能是我們一直在等待的轉折點 — 這是一項可以真正幫助我們的技術,並具有我們對人類同事所期望的大部分前瞻性和敏銳度。考慮下列事項:
最近有很多關於 LLM 對行銷工作流程的影響,它們可以產生文字、圖像甚至網頁排版的能力被視為領域的一步改變。然而,在實際上,情況更加複雜,因為需要大量手動努力,才能將 LLM 的輸出整合到整個過程中,例如:構想新的活動並推出結果的完整過程中。目前,即使是最好的生成式 AI,也只會真正自動化該過程的選擇性部分。
然而,我們預計行銷的 AI 智慧代理將採用更廣泛、更類似 LAM 的方法來為營銷團隊提供結果,通過使用 LLM 介面來連接數據,工具和特定領域的代理程序,以實現高層次任務。例如,想像一個如下的請求:
「發送行銷電子郵件,以突出我們新的 Chocho 巧克力的價值。給前 100 名購買者免運費的優惠。確保每位收件者都收到個性化的消息。」
LLM 很難獨立實現這一目標。不過,一系列工具、代理商和資料來源,包括存取以前的行銷材料、組織選擇與 LAM 共享的客戶數據,當然還有 LLM 本身,可以從突出顯示最新產品發展的文件(「我們新 Choco Choco Chocolate 的價值」)產生副本(「發送營銷電子郵件」),分解請求邏輯(「前 100 名購買者免運費)並輕鬆處理客戶特定的觸摸(「確保每個收件人都收到個性化消息」)。
但是個人助理旨在幫助一個人的整個生活,而不僅僅是工作。因此,讓我們想像他們如何幫助做出重要但個人的購買決定,例如汽車。對許多人來說,購買車輛的過程可能比興奮更加麻煩,尤其是研究階段可能會令人難以置信。但是,使用 LAM,它可能很快只需要如下所示的提示:
我正在尋找具有良好的安全評級和大空間的轎車,理想是深色。不早於 2014 年,但不超過 28,000 美元。里程數低於 90,000。
對於人類和 LAM 來說,第一步是掃描汽車購買網站以建立初始選項列表。LLM 的強大文本理解功能,使代理可以使用來自專業人士和使用者的大量汽車評論,快速識別滿足使用者參數的候選人。此外,LAM 可能會注意到紅標,例如:注意到適合車型的特定年分,曾因變速箱或電機問題而聞名,並將其從列表中刪除(或至少標註免責聲明)。
下一步,LAM 甚至可以與私人賣家和當地經銷商開始對話,使用電子郵件或甚至簡訊等管道聯繫。雖然一個好的 LAM 可能會宣布它是 AI,確保人類永遠不會被誤導,但它仍然會以清晰、流暢的自然語言進行交流,並在每個消息中都包含問候語,完整的句子以及明確的請求或陳述。使用者的銀行甚至可能會收到通知,讓他們知道應該提出貸款。當對話接近決策階段時,則可以納入使用者以進行最終核准。
最終,Salesforce AI 致力於利用技術的力量來改善企業各種規模的運作方式,LAM 是未來幾年可能看到這種情況的好例子。我相信這個願景將涵蓋營運的各個方面,從後台到行銷前線,包括我們甚至無法想像的應用程序,但可能沒有比與客戶互動更好的單一例子。
例如,想像一個保險公司的代理人。該代理人的一天的重要行程將是與現有和潛在的客戶會面,以討論他們的需求並發展關係。這個過程的核心是唯有人類代理才能提供的親切感,但周圍則環繞著大量重複性任務,這些任務可以由大型行動模型 (LAM) 大幅加速。考慮下列流程,由生成式 AI 從一個步驟拓展到下一步:
我認為這是個人賦權的一個引人入勝的願景,但真正的轉型來自 LAM 的可擴展性。想像一個整個企業使用如此複雜的工具來增強員工,並且總計可以節省多少時間和費用,更不用說 LAM 建議可以幫助防止錯誤、建議成功策略等。這是一種可以在任何規模的部署中真正提供價值的技術。
到目前為止,我們已經談論了為個人使用者提供服務的 LAM,但這項技術可能會採取更多種形式。想像可以為團體甚至整個組織提供服務的 LAM 同樣容易。雖然所有 LAM 都會受益於其靈活性,但我期望從非常一般的概念(類似上面所述的「執行助理」概念)到高度量身定制的領域特定代理人,以解決利基層問題的高度量身定制的代理商將有多樣化的可能性。許多 LAM — 最終全部都會被設計為從其經驗中學習,無論是在解決組織問題方面的越來越多的專業知識,還是根據個別使用者的需求和喜好越來越個性化。
誰說 LAM 將單獨運作?人們可以輕鬆地想像多個 LAM 一起合作,每個 LAM 都針對不同的目標進行最佳化調整,另一個 LAM 專門用於協調其努力並與使用者進行溝通的任務,無論是個人、團隊甚至整個組織。換句話說,這將是從單一個人助理升級到整個團隊,並由一位「幕僚長」統合,向負責人匯報。
當我們考慮到專門設計來與其他 LAM 或 LAM 團隊互動的 LAMs,這些可能性就更加引人入勝;舉例來說,上述汽車經銷商中,若有一個智慧代理專門處理代表潛在客戶的個人 LAM 所發出的來電請求,或與代表汽車製造商本身的 LAM 進行迭代互動,情況將會如何?這些 LAM 將保有所有 LAM 具備的透明度與通用性,特別是在事後評估其行為時更具價值,但同時能以機器對機器通訊所帶來的更高速度和效率運作。
瞭解由 AI 人工智慧技術所驅動的代理與團隊成員若能夠彼此互相合作的話,究竟可以為您省下多少的時間和金錢成本。只要回答幾個簡單的問題,即可查看 Agentforce 能夠為您帶來什麼樣的可能性。
儘管在實現 LAM 的全部潛力過程中仍有許多技術難關,但核心挑戰其實很簡單:世界並非靜態不變,任何旨在與之互動的代理都必須具備足夠的彈性,以優雅地適應不斷變化的環境。以我們購車的例子來說,這意味著要持續追蹤潛在客戶,並在使用者尚未出價前即時發現心儀車輛已被售出,甚至在研究過程中若發生召回事件,也能更新其建議。在我們的保險機構的例子中,對於提供有用和最新的信息,從行業法規的變化到極端天氣事件,對於提供有用和最新的信息,意識到當前事件(尤其是客戶當地的事件)將是至關重要的。
在所有情況下,良好的 LAM 都會通過了解何時通知其人類使用者或要求澄清的情況來定義自己。太頻繁地執行這項操作會令人煩惱和干擾,甚至可能從一開始就抵銷了 LAM 的好處。然而,若更新頻率過低,幾乎必然導致潛在嚴重且不良的副作用滋長,包含刪除重要郵件、以使用者名義向銀行申請不必要貸款等。像一個好的個人助理一樣,LAM 將需要良好的直覺和本能才能達到正確的平衡。
這也意味著利用 LAM 最強大的功能之一,即它們的學習能力。隨著 LAM 接觸到越來越多與我們一起工作的真實經驗,人類的回饋可以用於進一步調整它們的行為。此外,LAM 可以通過研究從客戶服務轉錄到事件記錄等各種數據來提取流程和流程的寶貴解釋,將理想步驟組合在一起,將給定的起點與最理想的結果連接起來。
明確地說,LAM 工作不僅僅是將請求轉換為一系列步驟,而是了解連接和周圍它們的邏輯。這意味著了解為什麼一個步驟必須在另一個步驟之前或之後發生,並知道何時是時候改變計劃以適應情況的變化。這是我們在日常生活中一直展示的能力。例如:當我們沒有足夠的雞蛋製作煎蛋時,我們知道第一步與烹飪無關,而是去最近的雜貨店。是時候打造可以做到同樣決策的技術了。
毫無疑問,LAM 將在上述許多例子所需的流利性和溝通方面變得非常出色。但仍無法確保它們能以足夠的一致性,在現實世界中以可預測且有效的方式運作,達到日常使用的標準。
當然,若說在生成文字和圖片時信任已是個挑戰 — 這確實如此 — 那在執行行動時,這個挑戰就更為重大。確保安全性和可靠性的負擔只有在多個 LAM 一起合作時才會增加。因此,我相信即使在最獨立的情況下,LAM 也是設計的是為了在採取重要行動之前讓人類保持聯繫。無論這項技術有多先進,我都將它視為一種工具(儘管是一種非常聰明的工具),並且人類始終可以隨時隨地控制的工具。
利用自主式的 AI 智慧代理來翻轉各個角色、工作流程和產業的作業方式。
經歷了十年來的 AI 發展,這段歷程可謂劃時代,而 LAM 的潛力正因如此令人期待,讓我們許多研究領域的人都感受到,最大的變革才正開始浮現。在正確的指引與致力於賦權於人類的前提下,我相信大型行動模型 (LAM) 能開啟一個具生產力、便利與清晰明瞭的新時代,讓我們在最投入的工作中表現更佳,同時讓我們免於執行那些不喜歡的任務。憑藉其在企業領域數十年的歷史,我無法想像有比 Salesforce 更適合實現這個願景的地方。
特別感謝 Alex Michael、Peter Schwartz 及 Salesforce Futures 團隊對本文撰寫的貢獻。