
O que são LLMs (grandes modelos de linguagem)?
Os grandes modelos de linguagem (LLMs) sustentam o crescimento da IA generativa. Saiba como eles funcionam, como estão sendo usados e por que são importantes para a sua empresa.
Os grandes modelos de linguagem (LLMs) sustentam o crescimento da IA generativa. Saiba como eles funcionam, como estão sendo usados e por que são importantes para a sua empresa.
Quando você usa a IA generativa para resumir um relatório ou redigir um texto de redes sociais, os grandes modelos de linguagem (LLMs) fazem isso acontecer. Os LLMs são a tecnologia subjacente que alimenta a IA generativa. E, à medida que os LLMs extraem mais dados, eles são capazes de gerar resultados mais precisos. Isso é essencial para empresas, que podem usar LLMs para oferecer aos clientes um conteúdo mais relevante e personalizado.
Os avanços na inteligência artificial (IA) impulsionados pelos LLMs também possibilitam que as empresas criem e implantem agentes de IA. Ao receber um prompt de clientes ou funcionários, esses sistemas inteligentes são capazes de resolver problemas complexos usando memória, raciocínio sequencial e autorreflexão.
Vamos nos aprofundar no é um LLM, em como esses modelos funcionam e em quais áreas eles podem beneficiar a sua empresa.
Os grandes modelos de linguagem (LLMs) são os motores que impulsionam a IA generativa. Os LLMs podem entender e responder a perguntas com linguagem natural porque são treinados em grandes quantidades de dados de texto. Esses modelos atualmente são usados para criar conteúdo visual e de texto, criar resumos e escrever novos códigos.
Os usuários interagem com os LLMs por meio de prompts, perguntas e contexto que são escritos em linguagem natural e são enviados ao modelo. Por exemplo, você pode pedir a um modelo de IA generativa que crie um resumo deste artigo. Primeiro, você enviaria o texto do artigo para sua ferramenta de IA para que ela o ingira e analise. Em seguida, você escreveria o prompt detalhando o que deseja. Em seguida, o LLM produziria um resumo de alto nível. Quanto mais dados forem usados para treinar o modelo, mais completos e precisos serão os resultados.
Com os dados certos, as empresas podem usar LLMs de diversas formas; por exemplo, a sua equipe de vendas pode usar a IA para tarefas como gerar propostas, sempre utilizando dados relevantes do cliente que informam sobre pontos problemáticos e preferências.
A IA da Salesforce oferece inteligência artificial confiável e extensível, com base na estrutura da nossa Salesforce Platform. Utilize a nossa IA nos dados de seus clientes para criar experiências de IA personalizadas, preditivas e generativas para atender a todas as suas necessidades de negócio com segurança. Leve a IA conversacional a qualquer fluxo de trabalho, usuário, departamento e indústria com o Einstein.
Antes de começar a se aprofundar mais em sua estratégia de IA generativa, saiba como essa tecnologia leva você do prompt ao resultado. Os grandes modelos de linguagem dependem de três componentes: aprendizado de máquina (e aprendizagem profunda), redes neurais e modelos de transformadores.
Os algoritmos de aprendizado de máquina (ML) instruem os LLMs sobre como coletar dados, descobrir conexões e identificar características comuns.
A aprendizagem profunda é um subconjunto do ML que permite que os LLMs aprendam com menos intervenção humana e usa uma abordagem probabilística para melhorar a precisão. Considere um LLM que analisa 1.000 frases. As ferramentas de aprendizagem profunda identificam que as letras "E", "T", "A" e "O" aparecem com mais frequência. A partir daí, o modelo extrapola (corretamente) que estas estão entre as letras mais usadas em inglês.
As redes neurais, também chamadas de redes neurais artificiais (ANNs), são grupos de nós conectados capazes de se comunicar entre si. Esses nós são organizados em camadas, incluindo entrada, saída e pelo menos uma camada intermediária, e possibilitam que os LLMs processem informações rapidamente. Essas redes são vagamente baseadas nas redes neurais do cérebro humano, mas são muito menos complexas.
Os modelos transformadores ajudam os LLMs a entender o contexto da linguagem. Usando uma técnica conhecida como autoatenção, esses modelos podem analisar a estrutura da frase e a escolha de palavras para entender como os elementos da linguagem se relacionam entre si. Isso permite que os LLMs entendam e processem melhor as consultas dos usuários.
Os LLMs entendem o texto de forma diferente dependendo dos modelos usados por eles. Os modelos somente codificador se concentram em dar sentido ao texto fornecido, enquanto os modelos somente decodificador geram texto com base em um prompt. Quando você os reúne — codificador-decodificador — os LLMs são capazes de entender e gerar texto, assumindo tarefas baseadas em linguagem, como atendimento ao cliente ou vendas. Por exemplo, um chatbot de IA orientado por LLM pode ser usado para responder às perguntas dos clientes sobre prazos de entrega, detalhes do produto ou mudanças de preços, liberando representantes humanos para trabalhar em tarefas mais estratégicas.
Há vários tipos de agentes de LLM, mas independentemente de qual deles é usado, o treinamento melhora a precisão e a confiabilidade dos resultados. Como as redes neurais baseadas em transformadores podem incluir bilhões de parâmetros, é necessário treinamento para garantir que os parâmetros sejam corretamente ponderados e aplicados às consultas. Diferentes modelos de treinamento podem ser mais ou menos eficazes, dependendo da complexidade e do caso de uso de um LLM.
No Aprendizado zero-shot, os LLMs são treinados em tempo real. Os usuários fazem perguntas, e os LLMs classificam as fontes de dados conectadas para encontrar respostas. A precisão inicial geralmente é baixa, mas melhora com o tempo.
Em uma abordagem few-shot, os cientistas de dados fornecem uma pequena seleção de exemplos relevantes para ajudar os LLMs a estabelecer conexões básicas. O treinamento few-shot melhora significativamente a precisão em áreas específicas.
O treinamento em cadeia de pensamento (CoT) orienta os LLMs por um processo de raciocínio simples. Em vez de fazer uma única pergunta, o CoT a divide em várias partes. Aqui está um exemplo:
Prompt padrão:
Steve tem 20 camisas. Metade das camisas são de manga curta, e a outra metade são azuis. Quantas camisas azuis ele tem?
Prompt de CoT:
Steve tem 20 camisas.
Metade das camisas são de manga curta. Isso significa que ele tem 10 camisas de manga curta.
Metade dessas camisas são azuis, o que significa que ele tem 5 camisas azuis.
Embora o prompt em si não seja particularmente complicado, o CoT fornece uma abordagem passo a passo para a solução de problemas que mostra a um LLM como responder à pergunta. Essa abordagem pode então ser aplicada a outras perguntas.
Modelos de ajustes detalhados e específicos de domínio fornecem informações contextuais adicionais para casos de uso específicos. Por exemplo, uma empresa que busca melhorar a análise de sentimento nas redes sociais pode fornecer ao LLM informações detalhadas sobre como entender palavras e frases específicas dentro do contexto mais amplo das plataformas sociais.
Nesse tipo de modelo, em vez de olhar para o texto em si, o modelo o traduz em números — chamados de vetores. Ao usar números, os computadores podem usar o aprendizado de máquina para analisar mais facilmente como as palavras e frases são colocadas juntas e, assim, entender o contexto e o significado semântico para identificar as relações entre as palavras.
Em um modelo multimodal, os LLMs são treinados para usar vários formatos de dados para entrada e saída. Além de texto, esses formatos podem incluir dados de áudio, vídeo ou imagem.
IA empresarial integrada diretamente ao seu CRM. Aumente a produtividade em toda a sua organização levando a IA empresarial para todos os apps, usuários e fluxos de trabalho. Permita que os usuários ofereçam aos clientes experiências mais impactantes em vendas, serviço, comércio, entre outras áreas, com assistência de IA personalizada.
Os LLMs oferecem aos agentes de IA a capacidade de conversar em linguagem natural, mas isso na teoria é mais fácil do que na prática.
Os bots tradicionais exigem treinamento manual de modelos de linguagem natural para entender a linguagem do cliente e criar diálogos. Esse processo é extremamente demorado e caro para uma empresa, mas os LLMs oferecem alternativas mais simples.
Por exemplo, soluções como o Agentforce — a camada agêntica da Salesforce Platform — usam habilidades pré-criadas (bem como ações personalizadas com pouco código) em vez de obrigar você a passar por um longo processo de treinamento. O Agentforce também usa IA conversacional, por isso as interações com agentes parecerão mais naturais do que robóticas.
Outros casos de uso comuns de LLMs incluem:
A resposta simples? Provavelmente não.
A resposta mais completa? Na maioria dos casos, criar o seu próprio LLM é caro, demorado e desnecessário.
É caro porque você precisa investir na experiência e na infraestrutura para desenvolver um modelo de linguagem sob medida. É demorado porque você precisa fornecer uma grande quantidade de dados de treinamento e garantir que o treinamento resulte em resultados precisos. E é desnecessário porque, na maioria dos casos, você estaria reinventando a roda.
O uso de LLMs pré-treinados e de código aberto que vêm com segurança integrada geralmente fornece o melhor equilíbrio entre desempenho e proteção. As empresas podem aproveitar o poder dos modelos treinados usando trilhões de pontos de dados, sem se preocupar com a possibilidade de problemas no código inadvertidamente causarem um comprometimento. Você pode complementar as informações do modelo de LLM usando geração aumentada por recuperação (RAG), que combina os dados mais relevantes e proprietários da sua empresa.
Adote agentes autônomos de IA e transforme o jeito de trabalhar em todas as funções, fluxos de trabalho e setores.
Os LLMs oferecem uma série de vantagens para as organizações. Isso inclui a redução ou eliminação de processos manuais e a capacidade de descobrir novas tendências e insights usando as fontes de dados disponíveis. No entanto, para usar os LLMs de forma eficaz, as empresas devem reconhecer onde eles se destacam e onde podem ter dificuldades.
Veja algumas das principais vantagens e possíveis desvantagens dos LLMs:
Existem dois caminhos prováveis para o futuro dos LLMs: grandes e pequenos.
À medida que os algoritmos de aprendizagem profunda são aperfeiçoados, e os processadores ficam mais poderosos, os grandes modelos de linguagem serão capazes de lidar com volumes de dados maiores com mais rapidez e precisão do que nunca.
Ao mesmo tempo, provavelmente veremos o desenvolvimento de pequenos modelos de linguagem que aplicam o mesmo nível de desempenho a conjuntos de dados menores e mais rigorosamente controlados. Esses modelos menores possibilitam que as empresas definam parâmetros altamente especializados e recebam resultados de alta precisão.
Os grandes modelos de linguagem estão cada vez mais próximos de alcançar uma compreensão completa e contextual da comunicação. Embora a supervisão continue sendo um componente crítico no uso de LLMs, esses modelos oferecem uma maneira de preencher a lacuna entre a percepção humana e as operações de TI e possibilitam que falemos a mesma língua.
Agora que você tem uma compreensão mais profunda da IA, bem como dos LLMs, faça um tour pelo Agentforce. Com o Agentforce, você pode criar agentes de IA autônomos usando o LLM de sua escolha, no intuito de ajudar a sua empresa a fazer mais e impulsionar o ROI e a produtividade.
Veja mais detalhadamente como a criação de agentes funciona em nossa biblioteca.
Lance Agentforce com velocidade, confiança e ROI que você pode medir.
Conte-nos sobre as necessidades dos seus negócios, e ajudaremos você a encontrar respostas.