
什麼是大型語言模型 (LLM)?
大型語言模型(LLM)支持生成式 AI的發展。了解它們的工作方式、如何使用它們,以及為什麼它們對您的業務很重要。
大型語言模型(LLM)支持生成式 AI的發展。了解它們的工作方式、如何使用它們,以及為什麼它們對您的業務很重要。
大型語言模型(LLM)是驅動生成式 AI的引擎。LLM 可以用自然語言理解和回應問題,因為他們對大量文字數據進行了培訓。這些模型現在用於建立文字和視覺內容、建立摘要和編寫新程式碼。
使用者透過以自然語言撰寫的提示、問題和脈絡傳送至模型,與 LLM 進行互動。例如,您可以要求生成式 AI 模型建立本文的摘要。首先,您將文章的文字發送到您的 AI 工具,以便其吸收和分析。接下來,您將寫下提示,詳細說明您正在尋找的內容。法學碩士會將他們製作高層次的摘要。用於訓練模型的數據越多,結果就越完整和準確。
有了正確的數據,企業可以使用 LLM 的方式有很多,例如讓您的 銷售團隊使用 AI 進行產生推廣等任務 — 所有這些工作都使用可以說明痛點和偏好的相關客戶數據。
Salesforce AI 會以我們的 Salesforce Platform 平台為基礎,為您提供值得信賴且可擴充的 AI 服務。運用我們的 AI 來處理您的客戶資料,安全建立可自訂且具備預測性的生成式 AI 體驗,滿足您所有的業務需求。透過 Einstein,將對話式人工智慧導入各種工作流程、使用者、部門和產業。
在開始深入研究生成式 AI策略之前,請先熟悉這項技術如何將您從提示到輸出。大型語言模型取決於三個元件:機器(和深度)學習,神經網路和轉換器模型。
機器學習 (ML) 演演算法指示 LLM 如何收集資料、探索連線和識別常見功能。
深度學習是 ML 的一個子集,它允許 LLM 在較少的人為干預的情況下學習,並使用可能性方法來提高準確性。考慮一個分析 1,000 句的法學碩士。深度學習工具可確定字母「E」、「T」、「A」和「O」最常出現的字母。從那裡,模型將(正確地)預測這些字母是英語中最常用的字母之一。
神經網路,也稱為人工神經網路(ANN),是可以彼此通信的連接節點的群組。這些節點分為包括輸入、輸出和至少一個中層的層,讓 LLM 能夠快速處理資訊。這些網路鬆散基於人類大腦的神經網路,但複雜程度遠不太大。
轉換器模型可幫助 LLM 了解語言脈絡。使用一種稱為自我注意的技術,這些模型可以分析句子結構和單詞選擇,以了解語言元素如何彼此相關。這使 LLM 能夠更好地理解和處理使用者查詢。
LLM 根據他們使用的模型不同地理解文字。僅限編碼器模型專注於理解提供的文字,而僅用解碼器模型則會根據提示產生文字。當您將它們放在一起(編碼器和解碼器)時,LLM 可以理解和產生文字,從而承擔語言驅動的任務,例如客戶服務或銷售。例如,LLM 驅動的 AI 聊天機器人可以用來回答客戶關於運送時間、產品詳細資訊或定價變更的問題,從而釋放人力代表處理更具策略性的任務。
LLM 代理有很多類型,但無論您使用哪一種,培訓都可以提高其輸出的準確性和可靠性。鑑於基於轉換器的神經網路可以包含數十億個參數,因此需要訓練以確保參數正確加權並應用於查詢。根據 LLM 的複雜性和使用案例,不同的培訓模式可能會大多或少有效。
零速學習讓 LLM 即時受訓練。使用者提出問題,LLM 會在連接的數據來源進行排序以找到答案。初始準確度通常很低,但隨著時間的推移而提高。
數據科學家提供了一些相關範例,以幫助 LLM 建立基準連接。少擊訓練可顯著提高目標區域的準確度。
思想鏈(CoT)培訓導 LLM 透過簡單的推理過程。而不是問一個問題,CoT 將它分成多個部分。以下是一個例子:
標準提示:
史蒂夫有 20 件襯衫。他的襯衫中有一半是短袖,而這些襯衫中的一半是藍色。他有多少個藍襯衫?
CoT 提示:
史蒂夫有 20 件襯衫。
他的一半襯衫是短袖。這意味著他有 10 件短袖襯衫。
這些襯衫中的一半是藍色,這意味著他有 5 個藍色襯衫。
雖然提示本身並不特別複雜,但 CoT 提供了一種逐步解決問題的方法,向 LLM 展示如何回答問題。然後,這種方法可以應用於其他問題。
微調和網域特定模型為目標使用案例提供額外的脈絡資訊。例如,一家希望改善社交媒體情緒分析的公司可能會為其 LLM 提供有關如何在更廣泛的社交平台上理解特定單詞和短語的詳細資訊。
在這種類型的模型中,模型不是看文字本身,而是將其轉換為數字 —— 稱為向量。透過使用數字,計算機可以使用機器學習更輕鬆地分析單詞和句子在一起的方式,從而了解脈絡和語義含義,以識別單詞之間的關係。
在多模式模型中,LLM 被訓練使用多種數據格式進行輸入和輸出。除了文字之外,這些格式可能包括音頻,視頻或圖像數據。
LLM 使 AI 智慧代理能夠以自然語言交談的能力,但這說起來比做更容易。
傳統機器人要求您手動訓練自然語言模型以了解客戶語言和設計對話框。這個過程對企業來說非常耗時且昂貴,但 LLM 提供更簡單的替代方案。
例如,Agentforce ( Salesforce平台的代理層) 之類的解決方案使用預先建置的技能(以及低程式碼自定義操作),而不是讓您透過漫長的培訓過程。Agentforce 還使用對話式人工智慧,因此與代理的互動會比機器人更自然。
其他常見 LLM 使用案例包括:
簡單的答案?可能不是
更完整的答案?在大多數情況下,建立自己的 LLM 是昂貴、耗時且不必要的。
它很昂貴,因為您需要投資專業知識和基礎架構來開發定制的語言模型。這很耗時,因為您需要提供大量的訓練資料,並確保訓練結果獲得準確的結果。而且這是不必要的,因為在大多數情況下,您正在重新發明輪子。
使用具有內建安全護欄的預先訓練的開放原始碼 LLM 通常可提供最佳的效能和保護平衡。企業可以利用使用數億個資料點訓練的模型的力量,而不必擔心程式碼中的問題可能會導致意外的妥協。您可以使用 RAG(檢索增強型產生)來補充 LLM 模型的資訊,該產品結合貴公司最相關和專有的數據。
利用自主式的 AI 智慧代理來翻轉各個角色、工作流程和產業的作業方式。
LLM 為組織提供了許多優勢。這些包括減少或消除手動流程,以及使用可用的資料來源發現新趨勢和洞察的能力。但是,為了有效地使用 LLM,企業必須認識到自己的優勢以及可能遇到困難的地方。
以下是 LLM 的一些主要優點,以及 LLM 的潛在缺點:
LLM 的未來可能有兩個路徑:更大和更小。
隨著深度學習演算法的改進,處理器變得更強大,大型語言模型將能夠比以往更快、更準確地處理更大的資料量。
與此同時,預期將發展的小語言模型將相同水平的效能應用於較小、更嚴格控制的數據集。這些較小的模型為公司提供了定義高度專業參數並接收高精度輸出的方法。
大型語言模型越來越接近對溝通的完整、脈絡理解。儘管監督仍然是 LLM 使用中的關鍵組成部分,但這些模型透過允許我們說同一種語言來彌合人類洞察和 IT 操作之間的差距的一種方法。
現在您更深入了解 AI 和 LLM,您可以參觀 Agentforce。使用 Agentforce,您可以使用您選擇的 LLM 建立自主人工智慧代理,幫助您的公司完成更多工作,從而提高投資報酬率和生產力。
深入探索我們資料庫中「代理建立」的運作方式。
與 Professional Services 的專家展開合作,帶您快速建置代理並看見其中的價值。
讓我們知道您有什麼樣的業務需求,我們會幫助您找到您所要找的解答。