{"id":21816,"date":"2024-08-09T17:34:56","date_gmt":"2024-08-09T17:34:56","guid":{"rendered":"https:\/\/www.salesforce.com\/?p=21816"},"modified":"2024-08-09T17:34:58","modified_gmt":"2024-08-09T17:34:58","slug":"mint-1t","status":"publish","type":"post","link":"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/","title":{"rendered":"Conhe\u00e7a o MINT-1T, Um Conjunto de dados Multimodal com Um Trilh\u00e3o de Tokens"},"content":{"rendered":"\n<p><em>Este post foi reescrito para melhor atender ao p\u00fablico-alvo do Brasil, mas n\u00e3o podemos deixar de ressaltar o maravilhoso trabalho realizado por esta equipe: Oscar Lo, Manli Shu, Hannah Lee, Etash Kumar Guha, Matt Jordan, Sheng Shen, Mohamed Awadalla, Silvio Savarese, Yejin Choi e Ludwig Schmidt.<\/em><\/p>\n\n\n\n<p>A Salesforce acaba de anunciar o \ud83c\udf43MINT-1T, um conjunto de dados de c\u00f3digo aberto, projetado para treinar modelos de intelig\u00eancia artificial que podem entender e trabalhar simultaneamente com texto e imagens. <\/p>\n\n\n\n<p>Chamado de &#8220;multimodal&#8221; por integrar diferentes tipos de dados e &#8220;intercalado&#8221; por combinar essas informa\u00e7\u00f5es em um \u00fanico fluxo cont\u00ednuo, o \ud83c\udf43MINT-1T \u00e9 o primeiro desse tipo a atingir a marca de um trilh\u00e3o de tokens de texto process\u00e1veis e 3,4 bilh\u00f5es de imagens, oferecendo uma ferramenta poderosa para o desenvolvimento de modelos que lidam com m\u00faltiplas modalidades de conte\u00fado.<br><br><img loading=\"lazy\" decoding=\"async\" width=\"624\" height=\"309\" src=\"https:\/\/lh7-rt.googleusercontent.com\/docsz\/AD_4nXdOVnxjKdUlnmlui5oMX66vByPGuBrrPzdWQSW5MBZLI2qXHZim_R1dDD4KDy5hVUV0MWQFR7lveLq0zVG7l9KxNMTL971BQmG8mriUNSHrgeU-iL6BwYaz6lsG6aLMl2wpUTYZ-VeEt8KCwW260cTGYHk?key=IdIG8dgyuX9RlUXIgL9yGA\"><\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-em-qual-contexto-nasce-o-mint-1t\">Em qual contexto nasce o MINT-1T<\/h2>\n\n\n\n<p>Documentos multimodais intercalados s\u00e3o essenciais para treinar grandes modelos que conseguem raciocinar sobre texto e imagens ao mesmo tempo, uma habilidade crucial para tarefas como legendagem de imagens ou resposta a perguntas visuais.<br><img loading=\"lazy\" decoding=\"async\" width=\"624\" height=\"319\" src=\"https:\/\/lh7-rt.googleusercontent.com\/docsz\/AD_4nXeWilz6cHCkaSmwEZzb6mpf1I1ODbpOTZ6tafWVDWOar-PDKbUqRrOdgDoYs61gR26Ns-J5VF_umbKPvXCb6ea9RxfzIKvi_F2PAr1JNMX52SxvyB_BJYKSYFRA02NlJgwyJag-MPji25wC_T9kn050fMia?key=IdIG8dgyuX9RlUXIgL9yGA\"><br><br>Modelos de ponta, como <a href=\"https:\/\/machinelearning.apple.com\/research\/mm1-methods-analysis-insights?ref=blog.salesforceairesearch.com\">MM1<\/a>, <a href=\"https:\/\/arxiv.org\/abs\/2405.09818?ref=blog.salesforceairesearch.com\">Chameleon<\/a>, e <a href=\"https:\/\/huggingface.co\/blog\/idefics2?ref=blog.salesforceairesearch.com\">Idefics2<\/a> , j\u00e1 demonstraram que o treinamento com dados intercalados \u00e9 fundamental para obter um desempenho superior. No entanto, at\u00e9 agora, havia uma car\u00eancia de conjuntos de dados multimodais de grande escala, o que limitava o desenvolvimento de modelos robustos e acess\u00edveis.<\/p>\n\n\n\n<p><em><strong>Para saber:<\/strong> <\/em><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/machinelearning.apple.com\/research\/mm1-methods-analysis-insights?ref=blog.salesforceairesearch.com\"><em>MM1<\/em><\/a><em>, <\/em><a href=\"https:\/\/arxiv.org\/abs\/2405.09818?ref=blog.salesforceairesearch.com\"><em>Chameleon<\/em><\/a><em>, e <\/em><a href=\"https:\/\/huggingface.co\/blog\/idefics2?ref=blog.salesforceairesearch.com\"><em>Idefics2<\/em><\/a><em> s\u00e3o modelos de intelig\u00eancia artificial que integram dados de texto e imagens, permitindo a realiza\u00e7\u00e3o de tarefas complexas, como interpretar imagens a partir de descri\u00e7\u00f5es textuais ou gerar texto com base em imagens. Eles fazem parte de uma nova gera\u00e7\u00e3o de modelos projetados para trabalhar simultaneamente com essas duas modalidades, oferecendo maior efici\u00eancia e precis\u00e3o na compreens\u00e3o e gera\u00e7\u00e3o de informa\u00e7\u00f5es de m\u00faltiplas fontes.<\/em><\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-como-o-mint-1t-foi-construido\">Como o MINT-1T foi constru\u00eddo<\/h2>\n\n\n\n<p>A Salesforce desenvolveu o \ud83c\udf43MINT-1T com o objetivo de escalar e diversificar os dados dispon\u00edveis. Em compara\u00e7\u00e3o com datasets anteriores, como <a href=\"https:\/\/huggingface.co\/datasets\/HuggingFaceM4\/OBELICS?ref=blog.salesforceairesearch.com\">OBELICS<\/a> e <a href=\"https:\/\/github.com\/allenai\/mmc4?ref=blog.salesforceairesearch.com\">MMC4<\/a>, que tinham 115 bilh\u00f5es de tokens, o MINT-1T \u00e9 dez vezes maior, com um trilh\u00e3o de tokens. Essa expans\u00e3o permite treinar modelos mais robustos, capazes de lidar com uma ampla gama de informa\u00e7\u00f5es. Al\u00e9m de documentos HTML, o MINT-1T inclui PDFs em larga escala e artigos do <a href=\"https:\/\/arxiv.org\/\">ArXiv<\/a>, ampliando significativamente a cobertura de t\u00f3picos, especialmente em \u00e1reas cient\u00edficas.<\/p>\n\n\n\n<figure data-wp-context=\"{&quot;imageId&quot;:&quot;69d447496877e&quot;}\" data-wp-interactive=\"core\/image\" data-wp-key=\"69d447496877e\" class=\"wp-block-image wp-lightbox-container\"><img decoding=\"async\" data-wp-class--hide=\"state.isContentHidden\" data-wp-class--show=\"state.isContentVisible\" data-wp-init=\"callbacks.setButtonStyles\" data-wp-on--click=\"actions.showLightbox\" data-wp-on--load=\"callbacks.setButtonStyles\" data-wp-on-window--resize=\"callbacks.setButtonStyles\" src=\"https:\/\/lh7-rt.googleusercontent.com\/docsz\/AD_4nXdNNdjVbriCpFrV6Vdu5rY6CkUSbJwGBo-kIkQc6PEBpmfbqXpMpxHZPw1ilDm3cpPFvEDWOkluXsfNvM_u8Fy9-j-YAIg7xZOmQPlADjbP9dYbBsWUmdXgcFY3j72SSoGAV9rd-qErraCi1NTAk5sH7Bdd?key=IdIG8dgyuX9RlUXIgL9yGA\" alt=\"\"\/><button\n\t\t\tclass=\"lightbox-trigger\"\n\t\t\ttype=\"button\"\n\t\t\taria-haspopup=\"dialog\"\n\t\t\taria-label=\"Enlarge\"\n\t\t\tdata-wp-init=\"callbacks.initTriggerButton\"\n\t\t\tdata-wp-on--click=\"actions.showLightbox\"\n\t\t\tdata-wp-style--right=\"state.imageButtonRight\"\n\t\t\tdata-wp-style--top=\"state.imageButtonTop\"\n\t\t>\n\t\t\t<svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"12\" height=\"12\" fill=\"none\" viewBox=\"0 0 12 12\">\n\t\t\t\t<path fill=\"#fff\" d=\"M2 0a2 2 0 0 0-2 2v2h1.5V2a.5.5 0 0 1 .5-.5h2V0H2Zm2 10.5H2a.5.5 0 0 1-.5-.5V8H0v2a2 2 0 0 0 2 2h2v-1.5ZM8 12v-1.5h2a.5.5 0 0 0 .5-.5V8H12v2a2 2 0 0 1-2 2H8Zm2-12a2 2 0 0 1 2 2v2h-1.5V2a.5.5 0 0 0-.5-.5H8V0h2Z\" \/>\n\t\t\t<\/svg>\n\t\t<\/button><\/figure>\n\n\n\n<p><em>Para saber: <\/em><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/arxiv.org\/\">ArXiv<\/a><em> \u00e9 um reposit\u00f3rio online onde pesquisadores de diversas \u00e1reas publicam vers\u00f5es preliminares de seus artigos cient\u00edficos. Fundado em 1991, permite que cientistas compartilhem suas descobertas rapidamente, antes da revis\u00e3o por pares e publica\u00e7\u00e3o oficial. \u00c9 amplamente usado para disseminar conhecimento e colaborar em novos trabalhos. A Salesforce implementou um rigoroso processo de engenharia para garantir a qualidade dos dados, preservando a ordem original de imagens e textos e aplicando filtragens avan\u00e7adas para remover conte\u00fado duplicado ou irrelevante.<\/em><\/li>\n\n\n\n<li><a href=\"https:\/\/huggingface.co\/datasets\/HuggingFaceM4\/OBELICS?ref=blog.salesforceairesearch.com\">OBELICS<\/a><em> \u00e9 um conjunto de dados multimodal de c\u00f3digo aberto, composto por textos e imagens intercalados, usado para treinar modelos de intelig\u00eancia artificial que trabalham com essas duas modalidades. Ele \u00e9 menor em escala, mas foi um dos primeiros datasets abertos voltados para esse tipo de treinamento.<\/em><\/li>\n\n\n\n<li><a href=\"https:\/\/github.com\/allenai\/mmc4?ref=blog.salesforceairesearch.com\">MMC4<\/a><em> \u00e9 outro conjunto de dados multimodal de c\u00f3digo aberto, focado em combinar textos e imagens para treinar modelos que integram essas modalidades. Ele foi projetado para fornecer uma base diversificada para o desenvolvimento de modelos de intelig\u00eancia artificial multimodal.<\/em><\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-experimentos-com-modelos\">Experimentos com Modelos<\/h2>\n\n\n\n<p>A Salesforce validou o \ud83c\udf43MINT-1T ao pr\u00e9-treinar modelos multimodais <a href=\"https:\/\/huggingface.co\/Salesforce\/xgen-mm-phi3-mini-instruct-r-v1?ref=blog.salesforceairesearch.com\">XGen-MM<\/a>, e os resultados em benchmarks de legendagem e resposta a perguntas visuais mostraram que o MINT-1T supera datasets anteriores, como o <a href=\"https:\/\/huggingface.co\/datasets\/HuggingFaceM4\/OBELICS?ref=blog.salesforceairesearch.com\">OBELICS<\/a>. Esses benchmarks s\u00e3o padr\u00f5es da ind\u00fastria para avaliar a capacidade dos modelos em gerar descri\u00e7\u00f5es precisas de imagens e responder corretamente a perguntas sobre conte\u00fado visual. O sucesso nesses testes demonstra a efic\u00e1cia do MINT-1T em melhorar a habilidade dos modelos de integrar e interpretar informa\u00e7\u00f5es de texto e imagem simultaneamente.<\/p>\n\n\n\n<figure data-wp-context=\"{&quot;imageId&quot;:&quot;69d4474969068&quot;}\" data-wp-interactive=\"core\/image\" data-wp-key=\"69d4474969068\" class=\"wp-block-image wp-lightbox-container\"><img decoding=\"async\" data-wp-class--hide=\"state.isContentHidden\" data-wp-class--show=\"state.isContentVisible\" data-wp-init=\"callbacks.setButtonStyles\" data-wp-on--click=\"actions.showLightbox\" data-wp-on--load=\"callbacks.setButtonStyles\" data-wp-on-window--resize=\"callbacks.setButtonStyles\" src=\"https:\/\/lh7-rt.googleusercontent.com\/docsz\/AD_4nXci9BmS6x09AGKo2U8Ztj8KpG5zU4X4yEA35DZUyGAPipbQP6VSehW0k_GoMh8yKWKpcrP-eko0vg_S_aUsL_BGXMlERJT1dlVWxQaTRuGrInmGokcaz65xX8htKkzcfiRiho6GCwMoZK5XxBDDt6f2ilUw?key=IdIG8dgyuX9RlUXIgL9yGA\" alt=\"\"\/><button\n\t\t\tclass=\"lightbox-trigger\"\n\t\t\ttype=\"button\"\n\t\t\taria-haspopup=\"dialog\"\n\t\t\taria-label=\"Enlarge\"\n\t\t\tdata-wp-init=\"callbacks.initTriggerButton\"\n\t\t\tdata-wp-on--click=\"actions.showLightbox\"\n\t\t\tdata-wp-style--right=\"state.imageButtonRight\"\n\t\t\tdata-wp-style--top=\"state.imageButtonTop\"\n\t\t>\n\t\t\t<svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"12\" height=\"12\" fill=\"none\" viewBox=\"0 0 12 12\">\n\t\t\t\t<path fill=\"#fff\" d=\"M2 0a2 2 0 0 0-2 2v2h1.5V2a.5.5 0 0 1 .5-.5h2V0H2Zm2 10.5H2a.5.5 0 0 1-.5-.5V8H0v2a2 2 0 0 0 2 2h2v-1.5ZM8 12v-1.5h2a.5.5 0 0 0 .5-.5V8H12v2a2 2 0 0 1-2 2H8Zm2-12a2 2 0 0 1 2 2v2h-1.5V2a.5.5 0 0 0-.5-.5H8V0h2Z\" \/>\n\t\t\t<\/svg>\n\t\t<\/button><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-o-que-podemos-esperar-do-mint-1t-pela-frente\">O que podemos esperar do MINT-1T pela frente?<\/h2>\n\n\n\n<p>A Salesforce j\u00e1 est\u00e1 avan\u00e7ando para treinar novas itera\u00e7\u00f5es dos modelos<a href=\"https:\/\/huggingface.co\/Salesforce\/xgen-mm-phi3-mini-instruct-r-v1?ref=blog.salesforceairesearch.com\"> XGen-MM<\/a> com o \ud83c\udf43MINT-1T e segue comprometida em oferecer \u00e0 comunidade os melhores conjuntos de dados e modelos de c\u00f3digo aberto. Novidades ser\u00e3o compartilhadas em breve!<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Explore Mais<\/h2>\n\n\n\n<p>A <a href=\"https:\/\/www.salesforceairesearch.com\/\">Salesforce AI Research<\/a>, a divis\u00e3o de pesquisa em intelig\u00eancia artificial da Salesforce, convida voc\u00ea a explorar mais sobre os conceitos discutidos neste post. A<a href=\"https:\/\/www.salesforceairesearch.com\/\"> Salesforce AI Research<\/a> \u00e9 respons\u00e1vel por desenvolver tecnologias de ponta que alavancam dados e intelig\u00eancia artificial para criar solu\u00e7\u00f5es inovadoras e acess\u00edveis. Conecte-se nas redes sociais e no site para receber atualiza\u00e7\u00f5es regulares sobre este e outros projetos de pesquisa.<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/github.com\/mlfoundations\/MINT-1T?ref=blog.salesforceairesearch.com\">Dataset<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/arxiv.org\/abs\/2406.11271?ref=blog.salesforceairesearch.com\">Paper<\/a><\/li>\n\n\n\n<li><a href=\"http:\/\/salesforceairesearch.com\/?ref=blog.salesforceairesearch.com\">Salesforce AI Research Website<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/blog.salesforceairesearch.com\/mint-1t\/\">Leia o post original<\/a><\/li>\n<\/ul>\n\n\n\n<p><em>A Salesforce agradece \u00e0 equipe <a href=\"https:\/\/blog.salesforceairesearch.com\/author\/le\/\"><strong>Le Xue<\/strong><\/a><strong>, <\/strong><a href=\"https:\/\/blog.salesforceairesearch.com\/author\/ran\/\"><strong>Ran Xu<\/strong><\/a><strong>, <\/strong><a href=\"https:\/\/blog.salesforceairesearch.com\/author\/anas\/\"><strong>Anas Awadalla<\/strong><\/a><strong>, <\/strong><a href=\"https:\/\/blog.salesforceairesearch.com\/author\/caiming\/\"><strong>Caiming Xiong<\/strong><\/a> e \u00e0 Srinath Reddy Meadusani e Lavanya Karanam, pelo trabalho incr\u00edvel, e a Paul Josel pela ajuda com o design das figuras.<\/em><\/p>\n\n\n\n<div class=\"layout-six wp-block-salesforce-blog-offer\">\n\t<div class=\"wp-block-offer__wrapper\">\n\n\t\t<div class=\"wp-block-offer__content\">\n\t\t\t<h2 class=\"wp-block-offer__title\">Conhe\u00e7a o Data Cloud<\/h2>\n\t\t\t\t\t\t\t<p class=\"wp-block-offer__description\">Capture e gerencie todos os dados de sua empresa em tempo  real e crie valor com insights acion\u00e1veis feitos por IA, tudo isso na plataforma de CRM n\u00ba 1 mundo.<\/p>\n\t\t\t\n\t\t\t\n\t\t\t\t\t\t\t<div class=\"wp-block-button\">\n\t\t\t\t\t<a class=\"wp-block-button__link\" target=\"_blank\" href=\"https:\/\/www.salesforce.com\/br\/form\/genie\/demo-video\/\">Ver demonstra\u00e7\u00e3o<\/a>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\n\t\t<div class=\"wp-block-offer__media\">\n\t\t\t<img loading=\"lazy\" decoding=\"async\" width=\"768\" height=\"432\" src=\"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2025\/07\/data-cloud-demo-form-page.png\" class=\"attachment-full size-full\" alt=\"\" srcset=\"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2025\/07\/data-cloud-demo-form-page.png 768w, https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2025\/07\/data-cloud-demo-form-page.png?w=300&amp;h=169 300w, https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2025\/07\/data-cloud-demo-form-page.png?w=150&amp;h=84 150w\" sizes=\"auto, (max-width: 768px) 100vw, 768px\" \/>\t\t<\/div>\n\t<\/div>\n\n\t\n\t<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Entenda o poder do MINT-1T, um conjunto de dados de c\u00f3digo aberto, projetado para treinar modelos de intelig\u00eancia artificial que podem entender e trabalhar simultaneamente com texto e imagens, lan\u00e7ado h\u00e1 pouco mais de 1 semana pela Salesforce.<\/p>\n","protected":false},"author":20,"featured_media":21818,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"sf_justforyou_enable_alt":true,"optimizely_content_id":"4659ea3a6c464481a1a9c9e0f3710c23","post_meta_title":"","ai_synopsis":"","_jetpack_memberships_contains_paid_content":false,"footnotes":""},"sf_topic":[943,850,973,974,1005,976],"sf_content_type":[],"blog":[1139,1169,1212,1227,1239,1272],"coauthors":[1099],"class_list":["post-21816","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","sf_topic-data-culture","sf_topic-analytics","sf_topic-customer-data-cloud","sf_topic-customer-data-platform","sf_topic-reports","sf_topic-data-visualization","blog-data-culture","blog-customer-data-cloud","blog-analytics","blog-customer-data-platform","blog-data-visualization","blog-reports"],"yoast_head":"<!-- This site is optimized with the Yoast SEO Premium plugin v27.2 (Yoast SEO v27.2) - https:\/\/yoast.com\/product\/yoast-seo-premium-wordpress\/ -->\n<title>Conhe\u00e7a o MINT-1T, Um Conjunto de dados Multimodal com Um Trilh\u00e3o de Tokens | Salesforce<\/title>\n<meta name=\"description\" content=\"Entenda o poder do MINT-1T, um conjunto de dados de c\u00f3digo aberto, projetado para treinar modelos de intelig\u00eancia artificial que podem entender e trabalhar simultaneamente com texto e imagens, lan\u00e7ado h\u00e1 pouco mais de 1 semana pela Salesforce.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/\" \/>\n<meta property=\"og:locale\" content=\"pt_BR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Conhe\u00e7a o MINT-1T, Um Conjunto de dados Multimodal com Um Trilh\u00e3o de Tokens\" \/>\n<meta property=\"og:description\" content=\"Entenda o poder do MINT-1T, um conjunto de dados de c\u00f3digo aberto, projetado para treinar modelos de intelig\u00eancia artificial que podem entender e trabalhar simultaneamente com texto e imagens, lan\u00e7ado h\u00e1 pouco mais de 1 semana pela Salesforce.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/\" \/>\n<meta property=\"og:site_name\" content=\"Salesforce\" \/>\n<meta property=\"article:published_time\" content=\"2024-08-09T17:34:56+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2024-08-09T17:34:58+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/08\/MINT-1T.png\" \/>\n\t<meta property=\"og:image:width\" content=\"969\" \/>\n\t<meta property=\"og:image:height\" content=\"481\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Isabella Montalv\u00e3o Rosa\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"Henrique S\u00e1\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. tempo de leitura\" \/>\n\t<meta name=\"twitter:data2\" content=\"6 minutos\" \/>\n\t<meta name=\"twitter:label3\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data3\" content=\"Isabella Montalv\u00e3o Rosa\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/\"},\"author\":[{\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/#\/schema\/person\/image\/a185bfa3842c21999a9f82cf8fe032a6\"}],\"headline\":\"Conhe\u00e7a o MINT-1T, Um Conjunto de dados Multimodal com Um Trilh\u00e3o de Tokens\",\"datePublished\":\"2024-08-09T17:34:56+00:00\",\"dateModified\":\"2024-08-09T17:34:58+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/\"},\"wordCount\":870,\"commentCount\":0,\"image\":{\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/08\/MINT-1T.png\",\"inLanguage\":\"pt-BR\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/\",\"url\":\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/\",\"name\":\"Conhe\u00e7a o MINT-1T, Um Conjunto de dados Multimodal com Um Trilh\u00e3o de Tokens | Salesforce\",\"isPartOf\":{\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/08\/MINT-1T.png\",\"datePublished\":\"2024-08-09T17:34:56+00:00\",\"dateModified\":\"2024-08-09T17:34:58+00:00\",\"author\":{\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/#\/schema\/person\/382adab553ea7d801d83caa644d32806\"},\"description\":\"Entenda o poder do MINT-1T, um conjunto de dados de c\u00f3digo aberto, projetado para treinar modelos de intelig\u00eancia artificial que podem entender e trabalhar simultaneamente com texto e imagens, lan\u00e7ado h\u00e1 pouco mais de 1 semana pela Salesforce.\",\"breadcrumb\":{\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#breadcrumb\"},\"inLanguage\":\"pt-BR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#primaryimage\",\"url\":\"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/08\/MINT-1T.png\",\"contentUrl\":\"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/08\/MINT-1T.png\",\"width\":969,\"height\":481},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/www.salesforce.com\/br\/blog\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Conhe\u00e7a o MINT-1T, Um Conjunto de dados Multimodal com Um Trilh\u00e3o de Tokens\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/#website\",\"url\":\"https:\/\/www.salesforce.com\/br\/blog\/\",\"name\":\"Salesforce\",\"description\":\"Not\u00edcias, dicas e insights do l\u00edder global em nuvem\",\"alternateName\":\"Salesforce Brasil\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/www.salesforce.com\/br\/blog\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"pt-BR\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/#\/schema\/person\/image\/a185bfa3842c21999a9f82cf8fe032a6\",\"name\":\"Isabella Montalv\u00e3o Rosa\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/www.salesforce.com\/br\/blog\/#\/schema\/person\/image\/75da8d2e95ccaaf8a582c020d0c28b57\",\"url\":\"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/04\/Isa.png?w=150&h=150&crop=1\",\"contentUrl\":\"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/04\/Isa.png?w=150&h=150&crop=1\",\"width\":\"150\",\"height\":\"150\",\"caption\":\"Isabella Montalv\u00e3o Rosa\"},\"description\":\"Especialista em Marketing e Dados, Data Cloud e CDP Blackbelt. Nos \u00faltimos anos, liderou o Projeto Pillar Owner de Data Cloud em LATAM e a iniciativa de Learning Fridays LATAM, para conhecimento acess\u00edvel e horizontalizado \u00e0 todos os solution engineers. Atualmente, ela lidera exclusivamente iniciativas internas de Data Cloud para aprimorar a ado\u00e7\u00e3o, uso, conhecimento e sucesso em conjunto com as Lideran\u00e7as Globais do Produto. Sua paix\u00e3o \u00e9 ajudar empresas a realizarem mudan\u00e7as transformacionais rumo a estrat\u00e9gias centradas no cliente e prepararem suas arquiteturas, processos e pessoas para um mundo hiperconectado. P\u00f3s-Graduada (MBA) em Arquitetura de Cloud pela FIAP, e em IA, Ci\u00eancia de Dados e Big Data pela PUC-RS, possui certifica\u00e7\u00f5es em Transforma\u00e7\u00e3o Digital pela Columbia Business School e em IA Generativa Aplicada pelo MIT. 8x certificada pela Salesforce e All Star Ranger no Trailhead.\",\"url\":\"https:\/\/www.salesforce.com\/br\/blog\/author\/isabella-montalvao-rosa\/\"}]}<\/script>\n<!-- \/ Yoast SEO Premium plugin. -->","yoast_head_json":{"title":"Conhe\u00e7a o MINT-1T, Um Conjunto de dados Multimodal com Um Trilh\u00e3o de Tokens | Salesforce","description":"Entenda o poder do MINT-1T, um conjunto de dados de c\u00f3digo aberto, projetado para treinar modelos de intelig\u00eancia artificial que podem entender e trabalhar simultaneamente com texto e imagens, lan\u00e7ado h\u00e1 pouco mais de 1 semana pela Salesforce.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/","og_locale":"pt_BR","og_type":"article","og_title":"Conhe\u00e7a o MINT-1T, Um Conjunto de dados Multimodal com Um Trilh\u00e3o de Tokens","og_description":"Entenda o poder do MINT-1T, um conjunto de dados de c\u00f3digo aberto, projetado para treinar modelos de intelig\u00eancia artificial que podem entender e trabalhar simultaneamente com texto e imagens, lan\u00e7ado h\u00e1 pouco mais de 1 semana pela Salesforce.","og_url":"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/","og_site_name":"Salesforce","article_published_time":"2024-08-09T17:34:56+00:00","article_modified_time":"2024-08-09T17:34:58+00:00","og_image":[{"width":969,"height":481,"url":"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/08\/MINT-1T.png","type":"image\/png"}],"author":"Isabella Montalv\u00e3o Rosa","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"Henrique S\u00e1","Est. tempo de leitura":"6 minutos","Written by":"Isabella Montalv\u00e3o Rosa"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#article","isPartOf":{"@id":"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/"},"author":[{"@id":"https:\/\/www.salesforce.com\/br\/blog\/#\/schema\/person\/image\/a185bfa3842c21999a9f82cf8fe032a6"}],"headline":"Conhe\u00e7a o MINT-1T, Um Conjunto de dados Multimodal com Um Trilh\u00e3o de Tokens","datePublished":"2024-08-09T17:34:56+00:00","dateModified":"2024-08-09T17:34:58+00:00","mainEntityOfPage":{"@id":"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/"},"wordCount":870,"commentCount":0,"image":{"@id":"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#primaryimage"},"thumbnailUrl":"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/08\/MINT-1T.png","inLanguage":"pt-BR","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/","url":"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/","name":"Conhe\u00e7a o MINT-1T, Um Conjunto de dados Multimodal com Um Trilh\u00e3o de Tokens | Salesforce","isPartOf":{"@id":"https:\/\/www.salesforce.com\/br\/blog\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#primaryimage"},"image":{"@id":"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#primaryimage"},"thumbnailUrl":"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/08\/MINT-1T.png","datePublished":"2024-08-09T17:34:56+00:00","dateModified":"2024-08-09T17:34:58+00:00","author":{"@id":"https:\/\/www.salesforce.com\/br\/blog\/#\/schema\/person\/382adab553ea7d801d83caa644d32806"},"description":"Entenda o poder do MINT-1T, um conjunto de dados de c\u00f3digo aberto, projetado para treinar modelos de intelig\u00eancia artificial que podem entender e trabalhar simultaneamente com texto e imagens, lan\u00e7ado h\u00e1 pouco mais de 1 semana pela Salesforce.","breadcrumb":{"@id":"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#breadcrumb"},"inLanguage":"pt-BR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/"]}]},{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#primaryimage","url":"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/08\/MINT-1T.png","contentUrl":"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/08\/MINT-1T.png","width":969,"height":481},{"@type":"BreadcrumbList","@id":"https:\/\/www.salesforce.com\/br\/blog\/mint-1t\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/www.salesforce.com\/br\/blog\/"},{"@type":"ListItem","position":2,"name":"Conhe\u00e7a o MINT-1T, Um Conjunto de dados Multimodal com Um Trilh\u00e3o de Tokens"}]},{"@type":"WebSite","@id":"https:\/\/www.salesforce.com\/br\/blog\/#website","url":"https:\/\/www.salesforce.com\/br\/blog\/","name":"Salesforce","description":"Not\u00edcias, dicas e insights do l\u00edder global em nuvem","alternateName":"Salesforce Brasil","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.salesforce.com\/br\/blog\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"pt-BR"},{"@type":"Person","@id":"https:\/\/www.salesforce.com\/br\/blog\/#\/schema\/person\/image\/a185bfa3842c21999a9f82cf8fe032a6","name":"Isabella Montalv\u00e3o Rosa","image":{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/www.salesforce.com\/br\/blog\/#\/schema\/person\/image\/75da8d2e95ccaaf8a582c020d0c28b57","url":"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/04\/Isa.png?w=150&h=150&crop=1","contentUrl":"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/04\/Isa.png?w=150&h=150&crop=1","width":"150","height":"150","caption":"Isabella Montalv\u00e3o Rosa"},"description":"Especialista em Marketing e Dados, Data Cloud e CDP Blackbelt. Nos \u00faltimos anos, liderou o Projeto Pillar Owner de Data Cloud em LATAM e a iniciativa de Learning Fridays LATAM, para conhecimento acess\u00edvel e horizontalizado \u00e0 todos os solution engineers. Atualmente, ela lidera exclusivamente iniciativas internas de Data Cloud para aprimorar a ado\u00e7\u00e3o, uso, conhecimento e sucesso em conjunto com as Lideran\u00e7as Globais do Produto. Sua paix\u00e3o \u00e9 ajudar empresas a realizarem mudan\u00e7as transformacionais rumo a estrat\u00e9gias centradas no cliente e prepararem suas arquiteturas, processos e pessoas para um mundo hiperconectado. P\u00f3s-Graduada (MBA) em Arquitetura de Cloud pela FIAP, e em IA, Ci\u00eancia de Dados e Big Data pela PUC-RS, possui certifica\u00e7\u00f5es em Transforma\u00e7\u00e3o Digital pela Columbia Business School e em IA Generativa Aplicada pelo MIT. 8x certificada pela Salesforce e All Star Ranger no Trailhead.","url":"https:\/\/www.salesforce.com\/br\/blog\/author\/isabella-montalvao-rosa\/"}]}},"jetpack_featured_media_url":"https:\/\/www.salesforce.com\/br\/blog\/wp-content\/uploads\/sites\/6\/2024\/08\/MINT-1T.png","jetpack_sharing_enabled":true,"distributor_meta":false,"distributor_terms":false,"distributor_media":false,"distributor_original_site_name":"Salesforce","distributor_original_site_url":"https:\/\/www.salesforce.com\/br\/blog","push-errors":false,"_links":{"self":[{"href":"https:\/\/www.salesforce.com\/br\/blog\/wp-json\/wp\/v2\/posts\/21816","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.salesforce.com\/br\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.salesforce.com\/br\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.salesforce.com\/br\/blog\/wp-json\/wp\/v2\/users\/20"}],"replies":[{"embeddable":true,"href":"https:\/\/www.salesforce.com\/br\/blog\/wp-json\/wp\/v2\/comments?post=21816"}],"version-history":[{"count":3,"href":"https:\/\/www.salesforce.com\/br\/blog\/wp-json\/wp\/v2\/posts\/21816\/revisions"}],"predecessor-version":[{"id":21820,"href":"https:\/\/www.salesforce.com\/br\/blog\/wp-json\/wp\/v2\/posts\/21816\/revisions\/21820"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.salesforce.com\/br\/blog\/wp-json\/wp\/v2\/media\/21818"}],"wp:attachment":[{"href":"https:\/\/www.salesforce.com\/br\/blog\/wp-json\/wp\/v2\/media?parent=21816"}],"wp:term":[{"taxonomy":"sf_topic","embeddable":true,"href":"https:\/\/www.salesforce.com\/br\/blog\/wp-json\/wp\/v2\/sf_topic?post=21816"},{"taxonomy":"sf_content_type","embeddable":true,"href":"https:\/\/www.salesforce.com\/br\/blog\/wp-json\/wp\/v2\/sf_content_type?post=21816"},{"taxonomy":"blog","embeddable":true,"href":"https:\/\/www.salesforce.com\/br\/blog\/wp-json\/wp\/v2\/blog?post=21816"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/www.salesforce.com\/br\/blog\/wp-json\/wp\/v2\/coauthors?post=21816"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}