
LLM(대규모 언어 모델)은 무엇인가요?
대규모 언어 모델(LLM)은 생성형 AI의 성장을 뒷받침합니다. LLM이 어떻게 작동하는지, 어떻게 사용되고 있는지, 그리고 왜 귀사에 중요한지 확인해 보세요.
대규모 언어 모델(LLM)은 생성형 AI의 성장을 뒷받침합니다. LLM이 어떻게 작동하는지, 어떻게 사용되고 있는지, 그리고 왜 귀사에 중요한지 확인해 보세요.
생성형 AI를 사용하여 보고서를 요약하거나 소셜 미디어 콘텐츠를 작성할 때, 이를 가능하게 하는 것이 대규모 언어 모델(LLM)입니다. LLM은 생성형 AI를 구동하는 기반 기술입니다. 더 많은 데이터를 소스로 사용할수록, 더 정확한 결과를 생성할 수 있습니다. LLM을 활용해 고객에게 더 관련성 있고 개인화된 콘텐츠를 제공할 수 있으므로, 기업에 필수적입니다.
LLM에 의해 촉진된 인공 지능(AI)의 발전으로 또한 기업이 AI 에이전트를 생성하고 배포하는 것이 가능해졌습니다. 고객이나 직원이 프롬프트를 입력하면, 이러한 지능형 시스템은 기억, 순차적 추론, 자기 성찰 등을 활용해 복잡한 문제를 해결할 수 있습니다.
LLM이 무엇인지, 이러한 모델이 어떻게 작동하는지, 그리고 비즈니스에 어떤 이점을 제공할 수 있는지 자세히 살펴보겠습니다.
대규모 언어 모델(LLM)은 생성형 AI를 구동하는 엔진입니다. LLM은 방대한 양의 텍스트 데이터로 훈련되었기 때문에 자연어 질문을 이해하고 질문에 응답할 수 있습니다. 현재 이 모델들은 텍스트 및 시각적 콘텐츠 생성, 요약 작성, 새로운 코드 작성 등에 사용되고 있습니다.
사용자는 프롬프트, 질문 및 맥락을 자연어로 작성하고 이것이 모델로 전송되는 방식으로 LLM과 상호 작용합니다. 예를 들어, 생성형 AI 모델에게 이 기사의 요약을 작성해 달라고 요청할 수 있습니다. 먼저, 기사 텍스트를 분석 및 처리하도록 AI 도구로 전송합니다. 다음으로, 원하는 내용을 상세히 설명하는 프롬프트를 작성합니다. 그러면 LLM이 대략적인 요약문을 생성합니다. 모델을 훈련하는 데 사용되는 데이터가 많으면 많을수록, 결과가 더욱 완전하고 정확해집니다.
적절한 데이터가 있다면, 기업은 다양한 방식으로 LLM을 사용할 수 있습니다. 예를 들어, 영업팀이 AI를 사용하여 세일즈 피치를 생성할 수 있습니다. 이는 고객이 안고 있는 문제점과 선호도를 말해 주는 관련 고객 데이터를 사용하여 가능합니다.
Salesforce AI는 Salesforce Platform의 패브릭에 기반한 신뢰할 수 있고 확장 가능한 AI를 제공합니다. Salesforce AI를 고객 데이터에 활용하여 모든 비즈니스 요구 사항에 맞는 맞춤형, 예측형, 생성형 AI 경험을 안전하게 생성하세요. Einstein을 통해 모든 워크플로, 사용자, 부서, 산업에 대화형 AI를 도입할 수 있습니다.
생성형 AI 전략에 깊이 들어가기에 앞서, 이 기술이 프롬프트에서 출력을 생성하는 원리에 익숙해지는 것이 좋습니다. 대규모 언어 모델은 기계 학습(및 심화 학습), 신경망, 그리고 트랜스포머 모델의 세 가지 구성 요소에 의존합니다.
기계 학습(ML) 알고리즘은 LLM에게 어떻게 데이터를 수집하고, 연결 관계를 발견하며, 공통된 특징을 식별할지 지시합니다.
심화 학습은 ML의 한 분야로, LLM이 더 적은 인간 개입으로도 학습할 수 있게 하며, 정확도를 향상하기 위해 확률적 접근 방식을 사용합니다. 1,000개의 문장을 분석하는 LLM을 생각해 보세요. 심화 학습 도구가 'E', 'T', 'A', 'O' 글자가 가장 자주 나타난다고 판별했습니다. 이 사실로 모델은 이 글자들이 영어에서 가장 자주 사용되는 글자 중 일부라고 정확히 추론합니다.
인공 신경망(ANN)이라고도 하는 신경망은 서로 통신할 수 있는 연결된 노드들의 집합입니다. 이 노드들은 입력, 출력, 그리고 한 개 이상의 중간층으로 구성된 계층으로 배열되며, 이를 통해 LLM이 정보를 빠르게 처리할 수 있습니다. 이 망은 대략 인간의 뇌 신경망에 기반을 두고 있지만, 훨씬 덜 복잡합니다.
트랜스포머 모델은 LLM이 언어적 맥락을 이해하는 데 도움을 줍니다. 셀프 어텐션이라는 기법을 사용해, 이러한 모델은 문장 구조와 단어 선택을 분석하여 언어의 요소들이 서로 어떻게 연관되는지 이해할 수 있습니다. 이로써 LLM은 사용자의 문의를 더 잘 이해하고 처리할 수 있습니다.
LLM은 사용하는 모델에 따라 텍스트를 다르게 이해합니다. 인코더 전용 모델은 제공된 텍스트의 의미를 이해하는 데 초점을 맞추는 반면, 디코더 전용 모델은 프롬프트를 기반으로 텍스트를 생성합니다. 인코더와 디코더를 결합하면 LLM은 텍스트를 이해하고 생성할 수 있으며, 고객 서비스 또는 영업과 같은 언어 기반 작업을 수행할 수 있습니다. 예를 들어, LLM 기반의 AI 챗봇은 배송 시간, 제품 세부 정보, 가격 변경 등에 관한 고객 문의에 답변하는 데 사용될 수 있는데, 이로써 인간 담당자는 더 전략적인 업무를 수행할 시간이 생깁니다.
다양한 LLM 에이전트의 유형이 있지만, 어떤 것을 사용하든 훈련으로 그 출력의 정확도와 신뢰도를 향상합니다. 트랜스포머 기반 신경망은 수십억 개의 매개변수를 포함할 수 있기 때문에, 문의에 따라 매개변수가 올바르게 가중치를 받고 적용되도록 보장하는 훈련이 필요합니다. LLM의 복잡성과 사용 사례에 따라 서로 다른 모델의 훈련 효과는 더 높거나 더 낮을 수 있습니다.
제로샷 학습은 LLM이 즉석에서 훈련되는 것입니다. 사용자가 질문하면 LLM은 연결된 데이터 소스를 검색하여 답을 찾습니다. 초기 정확도는 보통 낮지만, 시간이 지나면서 개선됩니다.
퓨샷 접근 방식에서는 데이터 과학자가 관련 예시 중 작은 선택 영역을 제공하여 LLM이 기준 연결을 구축하도록 돕습니다. 퓨샷 학습은 목표로 하는 영역에서 정확도를 크게 향상합니다.
생각의 사슬(CoT) 훈련은 LLM을 간단한 추론 과정으로 안내합니다. 하나의 질문을 하는 대신, CoT는 이를 여러 부분으로 나눕니다. 다음은 한 가지 예입니다.
표준 프롬프트:
스티브는 셔츠가 20벌 있습니다. 셔츠의 절반은 반팔이며, 그중 절반은 파란색입니다. 그는 파란 셔츠를 몇 벌 가지고 있나요?
CoT 프롬프트:
스티브는 셔츠가 20벌 있습니다.
셔츠의 절반은 반팔입니다. 이것은 그가 반팔 셔츠를 10벌 가지고 있다는 뜻입니다.
이러한 셔츠의 절반이 파란색이라면 그는 파란색 셔츠가 5벌 있다는 뜻입니다.
프롬프트 자체는 특별히 복잡하지 않지만, CoT는 문제 해결을 위한 단계별 접근 방식을 제공하여 LLM에게 질문에 어떻게 답할지 보여줍니다. 이 접근 방식은 다른 질문에도 적용될 수 있습니다.
정밀 조정 및 도메인 특정 모델은 원하는 사용 사례에 맞게 추가적인 맥락 정보를 제공합니다. 예를 들어, 소셜 미디어 분위기 분석을 개선하려는 기업은 소셜 플랫폼의 광범위한 맥락 내에서 특정 단어와 구문을 이해하는 방법에 대한 상세한 정보를 LLM에 제공할 수 있습니다.
이 유형의 모델에서는 텍스트를 있는 그대로 보는 대신, 모델이 텍스트를 벡터라고 부르는 숫자로 변환합니다. 숫자를 사용함으로써 컴퓨터는 기계 학습을 사용하여 단어와 문장이 어떻게 배치되어 있는지 더 쉽게 분석할 수 있어서, 문맥과 의미론적 의미를 이해하여 단어 간의 관계를 파악할 수 있습니다.
멀티모달 모델에서, LLM은 입력과 출력에 다양한 데이터 형식을 사용하도록 훈련됩니다. 이러한 형식에는 텍스트와 함께 오디오, 동영상 또는 이미지 데이터가 포함될 수 있습니다.
LLM은 AI 에이전트에 자연어로 대화하는 능력을 주지만, 이는 말처럼 쉬운 일이 아닙니다.
전통적인 봇이 고객의 언어를 이해하고 대화를 설계하려면 자연어 모델을 수동으로 훈련시켜야 합니다. 이것은 기업에 있어 시간과 비용이 매우 많이 드는 과정인데, LLM은 훨씬 간단한 대안을 제공합니다.
예를 들어, Salesforce 플랫폼의 에이전트 계층인 Agentforce 같은 솔루션은 긴 훈련 과정을 거치는 대신, 사전 구축된 기술(및 로우코드 사용자 지정 조치)을 사용합니다. Agentforce는 또한 대화형 AI를 활용하므로, 에이전트와의 상호 작용이 로봇 같지 않고 더 자연스러울 것입니다.
다른 일반적인 LLM 사용 사례로 다음과 같은 것이 있습니다.
간단한 답변을 원하신다면, 아니요가 되겠습니다.
더 완전한 답은 다음과 같습니다. 대부분의 경우, 자체 LLM을 구축하는 것은 비용이 많이 들고 시간이 오래 걸리며 불필요합니다.
비용이 많이 드는 이유는 맞춤형 언어 모델을 개발하기 위해 전문 지식과 인프라에 투자해야 하기 때문입니다. 시간이 오래 걸리는 이유는 풍부한 훈련용 데이터를 제공해야 하며, 훈련 결과가 정확한 결과를 도출하는지 확인해야 하기 때문입니다. 그리고 이것은 불필요한 일입니다. 왜냐하면 대부분의 경우, 새로 만들려고 하는 것이 이미 있기 때문입니다.
사전 훈련되고, 내장된 보안 가드레일을 갖춘 오픈 소스 LLM을 사용하면, 많은 경우 성능과 보호 간에 최적의 균형을 제공합니다. 기업은 코드 내 문제로 인해 의도하지 않은 보안 훼손이 발생할 우려 없이 수조 개의 데이터 요소를 활용해 훈련된 모델의 힘을 활용할 수 있습니다. LLM 모델의 정보를 보완하기 위해 RAG(검색 증강 생성)를 사용할 수 있습니다. 이 기술은 가장 관련성 높은 귀사 소유의 데이터를 결합합니다.
자율 AI 에이전트를 통해 모든 역할, 워크플로, 산업에 걸쳐 작업 수행 방식을 혁신하세요.
LLM은 조직에 다수의 이점을 제공합니다. 여기에는 수동 프로세스의 감소 또는 제거와 이용 가능한 데이터 소스를 사용하여 새로운 추세와 인사이트를 발견하는 능력이 포함됩니다. 그러나 LLM을 효과적으로 활용하려면 기업은 LLM이 강점을 발휘하는 분야와 어려움을 겪을 수 있는 분야를 알아야 합니다.
다음에서 LLM의 주요 장점과 잠재적인 단점 몇 가지를 살펴봅니다.
LLM의 미래에는 더 큰 모델과 더 작은 모델의 두 갈래 길이 놓여 있는 것 같습니다.
심화 학습 알고리즘이 발전하고 프로세서가 더욱 강력해짐에 따라, 대규모 언어 모델은 그 어느 때보다 더 큰 데이터량을 더 빠르고 정확하게 처리할 수 있게 될 것입니다.
동시에, 같은 수준의 성능을 더 작고 더 엄격히 통제된 데이터 집합에 적용하는 소규모 언어 모델의 개발이 시작될 것입니다. 이 소규모 모델들은 기업에서 고도로 전문화된 매개변수를 정의하고 높은 정확도의 출력을 얻을 수 있는 방법을 제공합니다.
대규모 언어 모델은 완전하고 상황에 맞는 커뮤니케이션 이해에 점점 더 가까워지고 있습니다. LLM의 사용에서 감독은 여전히 중요한 요소로 남아 있지만, 이 모델은 인간적 인사이트와 IT 운영 간에 있는 간극을 메우는 방법을 제공함으로써 우리가 같은 언어로 소통할 수 있게 해 줍니다.
이제 LLM과 AI에 대한 이해가 한층 더 깊어지셨다면, Agentforce를 둘러보실 차례입니다. Agentforce를 통해 원하는 LLM을 이용해 자율적인 AI 에이전트를 구축할 수 있으며, ROI 및 생산성 증대를 제공하며 기업이 더 많은 성과를 내는 데 도움이 됩니다.