A importância de desenvolver LLMs para o contexto brasileiro

15 de out. de 2025

15 de out. de 2025

5 minutos de leitura

5 minutos de leitura

Os Large Language Models (LLMs), também chamados de grandes modelos de linguagem, estão ampliando as aplicações da Inteligência Artificial (IA) ao expandir seus usos para diferentes setores, inclusive aqueles altamente regulados.

Ferramentas como o ChatGPT, da OpenAI, tornaram-se populares e incitaram a curiosidade de empresas de todos os portes e campos de atuação. Essa curiosidade foi colocada em prática: segundo uma pesquisa da IBM, 37% das empresas na América Latina já incorporaram IA generativa em alguma parte de suas operações.

No entanto, embora essa tecnologia esteja em amplo uso por empresas e organizações brasileiras, a maioria dos LLMs é treinada com base em dados internacionais e, muitas vezes, não atende plenamente o contexto cultural, social e linguístico do Brasil. 

Nesse sentido, desenvolver LLMs brasileiros significa ter modelos que compreendam o contexto e a cultura do Brasil, o que, também, fomenta o desenvolvimento tecnológico do país.


Você verá neste artigo:

  • Desafios enfrentados pelo Brasil no uso de LLMs internacionais.

  • Benefícios de se desenvolver LLMs nacionais.

  • Exemplo de um LLM desenvolvido no Brasil.


Brasil enfrenta desafios ao usar LLMs internacionais

Em resumo, LLMs são modelos treinados com uma imensa quantidade de dados e capazes de compreender e produzir textos, imagens, chats e outros tipos de conteúdo de forma similar à humana.

Devido a bilhões de parâmetros, técnicas de Deep Learning e Processamento de Linguagem Natural (PLN), LLMs aprendem gramática, semântica e contextos a partir do aprendizado zero-shot e auto-supervisionado. Isso permite que ele gere respostas mais precisas e possa ser aplicado em mais contextos do que outros modelos de linguagem mais tradicionais.

Contudo, embora seja uma ferramenta potente, a adoção de LLMs internacionais pode trazer certas limitações para o Brasil. Entre os principais desafios estão:


  1. Limitações linguísticas: 

Modelos estrangeiros são treinados majoritariamente com dados em inglês e, embora eles consigam realizar tarefas em português, regionalismos, expressões populares e gírias, muitas vezes, não são compreendidas em sua totalidade. Isso pode prejudicar a realização de tarefas mais específicas.


  1. Barreiras de contexto: 

Dados internacionais não refletem a realidade de negócios, políticas públicas ou comportamento de consumidores no Brasil. Um LLM que não leva em conta essas especificidades pode oferecer respostas desalinhadas à realidade brasileira.


  1. Questões regulatórias: 

O estudo “IA Generativa e LGPD: transparência, desafios regulatórios e caminhos para a conformidade”, feito pela FGV (Fundação Getúlio Vargas), analisou as principais plataformas de IA generativa do mercado e concluiu que o cumprimento dos princípios da LGPD (Lei Geral de Proteção de Dados) está longe do ideal. No contexto brasileiro, a não adequação, por parte de ferramentas de IA, à legislação do país dificulta a adoção desses modelos, principalmente pelo governo e por setores regulados.

 

Como o desenvolvimento de LLMs brasileiros é benéfico para o país

Investir em LLMs nacionais, além de superar os desafios enfrentados pelo país, também proporciona uma série de vantagens competitivas e estratégicas para o Brasil, por exemplo:


  1. Precisão linguística

Modelos desenvolvidos e treinados em português brasileiro são capazes de compreender melhor as nuances da língua e da cultura do Brasil. Isso resulta em respostas mais precisas sobre o país com base em dados mais relevantes.


  1. Compliance regulatório: 

LLMs desenvolvidos no e para o Brasil consideram a LGPD e a legislação local, o que reduz os riscos jurídicos para empresas e garantem mais segurança para órgãos governamentais que estão aderindo — ou estudando como aderir — soluções de IA generativa.


  1. Soberania tecnológica

O desenvolvimento de modelos nacionais fortalece o setor de tecnologia do país e reduz a dependência de soluções estrangeiras. Além disso, o emprego de mão de obra brasileira especializada e a competitividade com modelos estrangeiros também exaltam a necessidade de se desenvolver LLMs voltados para o contexto brasileiro.

O desenvolvimento de LLMs para o contexto brasileiro traz benefícios tanto para empresas quanto para o país como um todo. Nesse sentido, veja dois exemplos de LLMs nacionais a seguir:

Jurema-7B

Desenvolvido a partir da parceria entre NeuralMind e Escavador, e com apoio da FINEP, o Jurema-7B é um LLM especializado no setor jurídico brasileiro. Desenvolvido a partir do ajuste fino do modelo Qwen2.5-7B-Instruct, Jurema-7B conta com 7 bilhões de parâmetros. 

Em comparação com seu modelo base, o novo modelo apresentou desempenho superior quando testado em três dos principais benchmarks disponíveis para o português brasileiro:

  • BLUEX: avalia compreensão e geração de texto em português;

  • ENEM: mede a capacidade do modelo em responder a questões de nível educacional amplo;

  • OAB: concentra-se em questões jurídicas, demonstrando como o modelo lida com o vocabulário e os conceitos do direito brasileiro.


O desempenho superior do Jurema-7B especialmente no benchmark da OAB demonstra que este modelo tem muito mais precisão em interpretar e responder questões jurídicas, o que reforça a sua adequação e relevância para aplicações no direito brasileiro.

Para garantir esse resultado, foi utilizado um dataset sintético com exemplos "derivados de uma coleção diversificada e curada de documentos jurídicos de alta qualidade, selecionados por sua representatividade, qualidade e diversidade".

Em versão Open Source, esse modelo pode ser utilizado para fins de pesquisa e desenvolvimento, e o seu uso ético e responsável é encorajado pelos desenvolvedores: por ser uma versão inicial do modelo, ele pode gerar respostas imprecisas ou incompletas, além não substituir o aconselhamento jurídico profissional.


A inteligência artificial já é o presente

Criar modelos que não apenas compreendam o português brasileiro em toda a sua diversidade, mas que também estejam preparados para lidar com os desafios específicos de setores como saúde, educação, finanças e governo do Brasil, é fundamental para fomentar o setor de IA do país e acompanhar a evolução dessa tecnologia.

Exemplos como o Jurema-7B mostram que não apenas é possível construir grandes modelos de linguagem nacionais, mas também que esse movimento é estratégico para reduzir a dependência tecnológica do Brasil, garantir conformidade com a LGPD e oferecer soluções de IA realmente eficazes para empresas e instituições brasileiras.

No campo jurídico, por exemplo, um LLM treinado com foco no direito brasileiro pode preencher lacunas tecnológicas importantes, tornando processos mais ágeis, acessíveis e confiáveis. Isso vale para outras áreas críticas, em que a proximidade cultural e regulatória faz toda a diferença na adoção da IA.

Quer ficar por dentro das principais novidades e oportunidades do mundo da inteligência artificial? Continue acompanhando o nosso blog e descubra como transformar o potencial da IA em resultados concretos para o seu negócio.

Revolucione o seu negócio hoje

Deixe que a IA faça a parte repetitiva, foque na estratégia.

Revolucione o seu negócio hoje

Deixe que a IA faça a parte repetitiva, foque na estratégia.

Revolucione o seu negócio hoje

Deixe que a IA faça a parte repetitiva, foque na estratégia.

Revolucione o seu negócio hoje

Deixe que a IA faça a parte repetitiva, foque na estratégia.