
LLM (โมเดลภาษาขนาดใหญ่) คืออะไร
โมเดลภาษาขนาดใหญ่ (LLM) สนับสนุนการเติบโตของ AI เชิงสร้างสรรค์ ดูว่าพวกเขาทำงานอย่างไร มีการใช้งานอย่างไร และเหตุใดพวกเขาจึงมีความสำคัญต่อธุรกิจของคุณ
โมเดลภาษาขนาดใหญ่ (LLM) สนับสนุนการเติบโตของ AI เชิงสร้างสรรค์ ดูว่าพวกเขาทำงานอย่างไร มีการใช้งานอย่างไร และเหตุใดพวกเขาจึงมีความสำคัญต่อธุรกิจของคุณ
เมื่อคุณใช้ AI เชิงสร้างสรรค์ในการสรุปรายงานหรือร่างเนื้อหาโซเชียลมีเดีย โมเดลภาษาขนาดใหญ่ (LLM) จะทำให้สิ่งนี้เกิดขึ้นได้ LLM เป็นเทคโนโลยีพื้นฐานที่ขับเคลื่อน AI เชิงสร้างสรรค์ และยิ่งดึงข้อมูลมากขึ้นก็ยิ่งสามารถสร้างผลลัพธ์ที่แม่นยำยิ่งขึ้นได้ สิ่งนี้มีความจำเป็นสำหรับธุรกิจที่สามารถใช้ LLM เพื่อมอบเนื้อหาที่เกี่ยวข้องและเป็นส่วนตัวมากขึ้นให้กับลูกค้า
ความก้าวหน้า ทางปัญญาประดิษฐ์ (AI) ที่ขับเคลื่อนโดย LLM ยังทำให้บริษัทต่างๆ สามารถ สร้างและใช้งานตัวแทน AI ได้ เมื่อได้รับคำกระตุ้นจากลูกค้าหรือพนักงาน ระบบอัจฉริยะเหล่านี้ก็สามารถแก้ไขปัญหาที่ซับซ้อนได้โดยใช้ความจำ การใช้เหตุผลแบบลำดับ และการไตร่ตรองตนเอง
มาเจาะลึกกันว่า LLM ประกอบด้วยอะไร โมเดลเหล่านี้ทำงานอย่างไร และมีประโยชน์ต่อธุรกิจของคุณอย่างไร
โมเดลภาษาขนาดใหญ่ (LLM) เป็นเครื่องมือขับเคลื่อน AI เชิงสร้างสรรค์ LLM สามารถเข้าใจและตอบคำถามด้วยภาษาธรรมชาติได้ เนื่องจากได้รับการฝึกฝนด้วยข้อมูลข้อความจำนวนมหาศาล ปัจจุบันโมเดลเหล่านี้ใช้ในการสร้างข้อความและเนื้อหาภาพ สร้างสรุป และเขียนโค้ดใหม่
ผู้ใช้โต้ตอบกับ LLM ผ่านคำกระตุ้น คำถาม และบริบทที่เขียนด้วยภาษาธรรมชาติที่ส่งไปยังโมเดล ตัวอย่างเช่น คุณสามารถขอให้โมเดล AI เชิงสร้างสรรค์ สรุปบทความนี้ ขั้นแรก คุณจะต้องส่งข้อความของบทความไปยังเครื่องมือ AI เพื่อให้มันประมวลผลและวิเคราะห์ ต่อไปคุณจะเขียนคำอธิบายโดยให้รายละเอียดสิ่งที่คุณกำลังมองหา LLM จะผลิตสรุประดับสูง ยิ่งใช้ข้อมูลในการฝึกโมเดลมากเท่าใด ผลลัพธ์ที่ได้ก็จะสมบูรณ์และแม่นยำมากขึ้นเท่านั้น
เมื่อมีข้อมูลที่ถูกต้องแล้ว ธุรกิจต่างๆ จะใช้ LLM ได้หลายวิธี เช่น การให้ ทีมขายของคุณใช้ AI ในงานต่างๆ เช่น การสร้างข้อเสนอการขาย โดยทั้งหมดนี้ใช้ข้อมูลลูกค้าที่เกี่ยวข้องที่ตรงกับปัญหาและความชอบส่วนบุคคล
Salesforce AI มอบ AI ที่เชื่อถือและขยายได้ซึ่งวางรากฐานอยู่ในโครงสร้างของ Salesforce Platformของเรา ใช้ประโยชน์จาก AI ของเราสำหรับข้อมูลลูกค้าของคุณเพื่อสร้างประสบการณ์ AI การสร้างที่ปรับแต่งและคาดการณ์ได้ ให้เหมาะกับทุกสิ่งที่ธุรกิจของคุณต้องการอย่างปลอดภัย นำ AI เชิงสนทนาไปใช้กับทุกเวิร์กโฟลว์ ผู้ใช้ แผนก และอุตสาหกรรมด้วย Einstein
ก่อนที่คุณจะเริ่มลงลึกเกินไปใน กลยุทธ์ AI เชิงสร้างสรรค์ ควรทำความคุ้นเคยกับวิธีที่เทคโนโลยีนี้พาคุณจากคำสั่งไปจนถึงผลลัพธ์ โมเดลภาษาขนาดใหญ่ขึ้นอยู่กับองค์ประกอบสามประการ ได้แก่ การเรียนรู้ของกลไกจักร (และเชิงลึก) เครือข่ายประสาท และโมเดลตัวแปลง
อัลกอริทึม การเรียนรู้ของกลไก (ML) สั่งให้ LLM รวบรวมข้อมูล ค้นพบการเชื่อมต่อ และระบุคุณลักษณะทั่วไป
การเรียนรู้เชิงลึกเป็นส่วนย่อยของ ML ที่ช่วยให้ LLM สามารถเรียนรู้โดยมีการแทรกแซงจากมนุษย์น้อยลง และใช้แนวทางความน่าจะเป็นเพื่อปรับปรุงความแม่นยำ ลองพิจารณา LLM ที่วิเคราะห์ประโยค 1,000 ประโยค เครื่องมือการเรียนรู้เชิงลึกจะระบุว่าตัวอักษร "E", "T", "A" และ "O" ปรากฏบ่อยที่สุด จากนั้นแบบจำลองจะสรุป (อย่างถูกต้อง) ว่านี่คือตัวอักษรที่ใช้มากที่สุดในภาษาอังกฤษ
เครือข่ายประสาท หรือเรียกอีกอย่างว่า เครือข่ายประสาทเทียม (ANN) เป็นกลุ่มของโหนดที่เชื่อมต่อกันซึ่งสามารถสื่อสารกันเองได้ โหนดเหล่านี้ได้รับการจัดเรียงเป็นชั้นๆ รวมถึงอินพุต เอาท์พุต และชั้นกลางอย่างน้อยหนึ่งชั้น และช่วยให้ LLM ประมวลผลข้อมูลได้อย่างรวดเร็ว เครือข่ายเหล่านี้มีพื้นฐานมาจากเครือข่ายประสาทของสมองมนุษย์อย่างหลวมๆ แต่มีความซับซ้อนน้อยกว่ามาก
โมเดลตัวแปลงช่วยให้ LLM เข้าใจบริบททางภาษา โดยใช้เทคนิคที่เรียกว่าการใส่ใจตนเอง โมเดลเหล่านี้สามารถวิเคราะห์โครงสร้างประโยคและการเลือกใช้คำเพื่อทำความเข้าใจว่าองค์ประกอบต่างๆ ของภาษามีความเกี่ยวข้องกันอย่างไร สิ่งนี้ช่วยให้ LLM เข้าใจและประมวลผลข้อสงสัยของผู้ใช้ได้ดีขึ้น
LLM เข้าใจข้อความต่างกันขึ้นอยู่กับโมเดลที่ใช้ โมเดลที่ใช้ตัวเข้ารหัสเท่านั้นจะเน้นที่การทำความเข้าใจข้อความที่ให้มา ในขณะที่โมเดลที่ใช้ตัวถอดรหัสเท่านั้นจะสร้างข้อความตามคำแนะนำ เมื่อคุณนำตัวเข้ารหัส-ตัวถอดรหัสมารวมกัน LLM จะสามารถเข้าใจและสร้างข้อความ โดยทำหน้าที่ที่ขับเคลื่อนด้วยภาษา เช่น บริการ ลูกค้าหรือ การขาย ตัวอย่างเช่น อาจใช้ แชทบอท AI ที่ขับเคลื่อนด้วย LLM เพื่อตอบคำถามของลูกค้าเกี่ยวกับเวลาการจัดส่ง รายละเอียดผลิตภัณฑ์ หรือการเปลี่ยนแปลงราคา ช่วยให้ตัวแทนของมนุษย์มีเวลาทำงานเชิงกลยุทธ์มากขึ้น
ตัวแทน LLM มีหลายประเภท แต่ไม่ว่าคุณจะใช้ประเภทใด การฝึกอบรมจะช่วยเพิ่มความแม่นยำและความน่าเชื่อถือของผลลัพธ์ เนื่องจากเครือข่ายประสาทที่ใช้ตัวแปลงสามารถรวมพารามิเตอร์ได้หลายพันล้านรายการ จึงจำเป็นต้องมีการฝึกอบรมเพื่อให้แน่ใจว่าพารามิเตอร์ได้รับการถ่วงน้ำหนักอย่างถูกต้องและนำไปใช้กับแบบสอบถาม รูปแบบการฝึกอบรมที่แตกต่างกันอาจมีประสิทธิภาพมากหรือน้อยขึ้นอยู่กับความซับซ้อนและกรณีการใช้งานของ LLM
การเรียนรู้แบบ Zero-shot ช่วยให้ผู้เรียน LLM ได้รับการฝึกอบรมอย่างรวดเร็ว ผู้ใช้จะถามคำถามและ LLM จะจัดเรียงผ่านแหล่ง ข้อมูล ที่เชื่อมต่อกันเพื่อค้นหาคำตอบ ความแม่นยำในเบื้องต้นมักจะต่ำ แต่จะดีขึ้นเมื่อเวลาผ่านไป
โดยใช้แนวทางการถ่ายภาพเพียงไม่กี่ช็อต นักวิทยาศาสตร์ข้อมูลจะนำเสนอตัวอย่างที่เกี่ยวข้องจำนวนเล็กน้อยเพื่อช่วยให้ LLM สร้างการเชื่อมโยงพื้นฐาน การฝึกยิงเพียงไม่กี่นัดจะช่วยเพิ่มความแม่นยำในพื้นที่เป้าหมายได้อย่างมาก
การฝึกอบรม Chain of Thought (CoT) ช่วยให้ผู้เรียน LLM ผ่านกระบวนการใช้เหตุผลแบบง่ายๆ แทนที่จะถามคำถามเดียว CoT จะแยกคำถามนั้นออกเป็นหลายส่วน นี่คือตัวอย่าง:
ข้อความแจ้งเตือนมาตรฐาน:
สตีฟมีเสื้อ 20 ตัว เสื้อเชิ้ตของเขาครึ่งหนึ่งเป็นแขนสั้น และอีกครึ่งหนึ่งเป็นสีน้ำเงิน เขามีเสื้อเชิ้ตสีฟ้ากี่ตัว
พรอมท์ CoT:
สตีฟมีเสื้อ 20 ตัว
เสื้อเชิ้ตของเขาครึ่งหนึ่งเป็นแขนสั้น นั่นหมายความว่าเขามีเสื้อแขนสั้น 10 ตัว
เสื้อเชิ้ตครึ่งหนึ่งเหล่านี้เป็นสีน้ำเงิน ซึ่งหมายความว่าเขามีเสื้อเชิ้ตสีน้ำเงิน 5 ตัว
แม้ว่าตัวพรอมท์นั้นจะไม่ซับซ้อนเป็นพิเศษ แต่ CoT ก็มีแนวทางการแก้ปัญหาแบบทีละขั้นตอนที่แสดงให้เห็นผู้ที่เรียน LLM ว่าควรตอบคำถามอย่างไร แนวทางนี้สามารถนำไปประยุกต์ใช้กับคำถามอื่นๆ ได้
การปรับแต่งอย่างละเอียดและโมเดลเฉพาะโดเมนให้ข้อมูลบริบทเพิ่มเติมสำหรับกรณีการใช้งานเป้าหมาย ตัวอย่างเช่น บริษัทที่ต้องการปรับปรุงการวิเคราะห์ความรู้สึกของโซเชียลมีเดียอาจให้ข้อมูลโดยละเอียดแก่หลักสูตร LLM เกี่ยวกับวิธีการทำความเข้าใจคำและวลีที่เจาะจงภายในบริบทที่กว้างขึ้นของแพลตฟอร์มโซเชียล
ในโมเดลประเภทนี้ แทนที่จะดูที่ข้อความนั้นเอง โมเดลจะแปลข้อความนั้นเป็นตัวเลข ซึ่งเรียกว่า เวกเตอร์ โดยการใช้ตัวเลข คอมพิวเตอร์สามารถใช้การเรียนรู้ของกลไกเพื่อวิเคราะห์ได้ง่ายขึ้นว่าคำและประโยคถูกจัดวางเข้าด้วยกันอย่างไร ทำให้เข้าใจบริบทและความหมายเพื่อระบุความสัมพันธ์ระหว่างคำต่างๆ
ในโมเดลหลายโหมด LLM จะถูกฝึกให้ใช้รูปแบบข้อมูลหลายรูปแบบสำหรับการอินพุตและเอาต์พุต รูปแบบเหล่านี้อาจรวมถึงข้อมูลเสียง วิดีโอ หรือรูปภาพควบคู่ไปกับข้อความ
AI ระดับองค์กรที่สร้างใน CRM ของคุณโดยตรง เพิ่มผลผลิตสูงสุดทั่วทั้งองค์กรของคุณด้วยการนำ AI สำหรับธุรกิจเข้าสู่ทุกการใช้งาน ผู้ใช้ และเวิร์กโฟลว์ ส่งเสริมให้ผู้ใช้ส่งมอบประสบการณ์ลูกค้าที่มีประสิทธิผลมากยิ่งขึ้นในด้านการขาย บริการ การค้า และอื่นๆ อีกมากมายด้วยความช่วยเหลือจาก AI เฉพาะบุคคล
LLM ช่วยให้ ตัวแทน AI สามารถสนทนาเป็นภาษาธรรมชาติได้ แต่พูดได้ง่ายกว่าทำ
บอทแบบดั้งเดิมต้องการให้คุณฝึกโมเดลภาษาธรรมชาติด้วยตนเองเพื่อทำความเข้าใจภาษาของลูกค้าและออกแบบกล่องโต้ตอบ กระบวนการนี้ใช้เวลานานมากและมีค่าใช้จ่ายสูงสำหรับธุรกิจ แต่ LLM ก็มีทางเลือกที่ง่ายกว่า
ตัวอย่างเช่น โซลูชันเช่น Agentforce ซึ่งเป็น เลเยอร์ตัวแทน ของ แพลตฟอร์ม Salesforce จะใช้ทักษะที่สร้างไว้ล่วงหน้า (เช่นเดียวกับการดำเนินการแบบกำหนดเองที่ใช้โค้ดน้อย) แทนที่จะให้คุณผ่านกระบวนการฝึกอบรมที่ยาวนาน Agentforce ยังใช้ AI เชิงสนทนา ดังนั้นการโต้ตอบกับตัวแทนจะรู้สึกเป็นธรรมชาติมากกว่าการใช้หุ่นยนต์
กรณีการใช้งาน LLM ทั่วไปอื่นๆ ได้แก่:
คำตอบง่ายๆ ก็คือ อาจจะไม่เป็นเช่นนั้น
คำตอบที่สมบูรณ์ยิ่งขึ้น ในกรณีส่วนใหญ่ การสร้างหลักสูตร LLM ด้วยตนเอง นั้นมีค่าใช้จ่ายสูง ใช้เวลานาน และไม่จำเป็น
มันแพงเพราะคุณต้องลงทุนในความเชี่ยวชาญและโครงสร้างพื้นฐานเพื่อพัฒนาโมเดลภาษาที่กำหนดเอง ใช้เวลานานเนื่องจากคุณต้องจัดเตรียมข้อมูลการฝึกอบรมจำนวนมาก และให้แน่ใจว่าผลลัพธ์การฝึกอบรมมีความแม่นยำ และมันไม่จำเป็นเพราะในกรณีส่วนใหญ่ คุณกำลังประดิษฐ์ล้อขึ้นมาใหม่
การใช้ LLM โอเพ่นซอร์สที่ ได้รับการฝึกอบรมล่วงหน้า ซึ่งมาพร้อมกับระบบรักษาความปลอดภัยในตัวมักจะให้สมดุลที่ดีที่สุดระหว่างประสิทธิภาพและการป้องกัน ธุรกิจสามารถใช้ประโยชน์จากพลังของโมเดลที่ฝึกอบรมโดยใช้จุดข้อมูลนับล้านล้านจุดโดยไม่ต้องกังวลว่าปัญหาในโค้ดอาจนำไปสู่การประนีประนอมโดยไม่ได้ตั้งใจ คุณสามารถเสริมข้อมูลของโมเดล LLM ได้ด้วยการใช้ RAG (retrieval-augmented generation) ซึ่งรวมข้อมูลที่เกี่ยวข้องและเป็นกรรมสิทธิ์ที่สุดของบริษัทของคุณ
เปลี่ยนแปลงวิธีการทำงานในทุกบทบาท เวิร์กโฟลว์ และอุตสาหกรรมด้วยตัวแทน AI อัตโนมัติ
หลักสูตร LLM มอบข้อดีมากมายให้กับองค์กร ซึ่งรวมถึงการลดหรือขจัดกระบวนการด้วยตนเอง และความสามารถในการค้นพบแนวโน้มและข้อมูลเชิงลึกใหม่ๆ โดยใช้แหล่งข้อมูลที่มีอยู่ อย่างไรก็ตาม เพื่อที่จะใช้ LLM ได้อย่างมีประสิทธิภาพ ธุรกิจต่างๆ จะต้องรู้ว่าตนเองมีความโดดเด่นในด้านใด และอาจประสบปัญหาในด้านใด
ต่อไปนี้คือข้อดีบางประการของ LLM และข้อเสียที่อาจเกิดขึ้นของ LLM:
อนาคตของ LLM มีแนวโน้มเป็นไปได้ 2 ทาง คือ ใหญ่ขึ้นและเล็กลง
เมื่ออัลกอริทึมการเรียนรู้เชิงลึกได้รับการปรับปรุงและโปรเซสเซอร์มีประสิทธิภาพมากขึ้น โมเดลภาษาขนาดใหญ่ก็จะสามารถจัดการข้อมูลปริมาณใหญ่ได้เร็วขึ้นและแม่นยำยิ่งขึ้นกว่าที่เคย
ในเวลาเดียวกัน คาดว่าจะได้เห็นการพัฒนา โมเดลภาษาขนาดเล็ก ที่ใช้ระดับประสิทธิภาพเดียวกันกับชุดข้อมูลขนาดเล็กที่มีการควบคุมอย่างเข้มงวดยิ่งขึ้น โมเดลขนาดเล็กเหล่านี้ช่วยให้บริษัทต่างๆ สามารถกำหนดพารามิเตอร์เฉพาะทางและรับเอาต์พุตที่มีความแม่นยำสูงได้
โมเดลภาษาขนาดใหญ่กำลังค่อยๆ เข้าใกล้ความเข้าใจเชิงบริบทที่สมบูรณ์ของการสื่อสารมากขึ้นเรื่อยๆ แม้ว่าการกำกับดูแลยังคงเป็นองค์ประกอบสำคัญในการใช้ LLM แต่โมเดลเหล่านี้ก็เสนอวิธีที่จะเชื่อมช่องว่างระหว่างข้อมูลเชิงลึกของมนุษย์และการดำเนินงานด้านไอทีด้วยการให้เราพูดภาษาเดียวกัน
ตอนนี้คุณมี ความเข้าใจเกี่ยวกับ AI และ LLM อย่างลึกซึ้งยิ่งขึ้นแล้ว คุณสามารถทัวร์สำรวจ Agentforce ได้ ด้วย Agentforce คุณสามารถสร้างตัวแทน AI อัตโนมัติโดยใช้ LLM ที่คุณเลือก ช่วยให้บริษัทของคุณทำงานได้มากขึ้น และยังช่วยเพิ่ม ROI และผลผลิตอีกด้วย
ศึกษารายละเอียดเพิ่มเติมเกี่ยวกับวิธีการสร้างตัวแทนในไลบรารีของเรา
เปิด Agentforce ด้วยความเร็ว ความมั่นใจและ ROI ที่คุณสามารถวัดได้
บอกเราเกี่ยวกับความต้องการทางธุรกิจของคุณ และเราจะช่วยคุณค้นหาคำตอบ