O Advento dos "Small Language Models" (SLMs) na Advocacia

18 de mai. de 2026

4 minutos de leitura

O setor jurídico brasileiro enfrenta um desafio de escala sem paralelos. Com um acúmulo que ultrapassa os 80 milhões de processos, segundo o relatório Justiça em Números do CNJ, a busca por eficiência deixou de ser um diferencial competitivo para se tornar uma necessidade de sobrevivência operacional. No entanto, a primeira onda de adoção de Inteligência Artificial Generativa trouxe consigo um dilema: grandes modelos de linguagem (LLMs), embora impressionantes em versatilidade, frequentemente falham em especificidade, custo/benefício e conformidade para a realidade jurídica.

É neste cenário que os Small Language Models (SLMs) emergem como uma solução técnica mais viável e estratégica. Diferente dos modelos massivos treinados com toda a internet, os SLMs são projetados para a especialização, provando que, no Direito, a densidade do conhecimento supera o volume bruto de parâmetros.

Por que "tamanho não é documento" na IA Jurídica

A métrica de sucesso de uma IA costumava ser a quantidade de parâmetros — as variáveis que o modelo aprende durante o treinamento. Os modelos generalistas mais conhecidos utilizam trilhões dessas variáveis. Contudo, para analisar um processo enorme ou redigir uma petição inicial, essa "enciclopédia global" é, em grande parte, ruído.

Os SLMs, geralmente definidos como modelos com menos de 10 bilhões de parâmetros, fundamentam-se no princípio de que dados de alta qualidade e curadoria especializada permitem que uma arquitetura menor performe de forma equivalente ou superior a modelos gigantes em tarefas específicas. Referências acadêmicas recentes, como o Technical Report do Phi-3 da Microsoft, demonstram que modelos compactos podem superar benchmarks de raciocínio lógico quando expostos a dados de alta qualidade.

Para o advogado, um modelo de IA ajustado para o jurídico brasileiro significa uma ferramenta que entende as nuances da doutrina brasileira e o rito processual sem a latência e o custo proibitivo das infraestruturas de nuvem de larga escala.

Eficiência de Inferência: Reduzindo Custos e Aumentando a Velocidade

Um dos principais obstáculos para a implementação de IA em departamentos jurídicos e escritórios de grande porte é o custo de tokens, quanto mais informação o LLM precisa processar e produzir, maior é o gasto. Manter um LLM generalista operando em fluxos de trabalho intensos pode drenar orçamentos rapidamente.

Os SLMs transformam essa economia por três vias:

Consumo de Hardware: Modelos menores podem rodar em GPUs menos potentes ou até mesmo em CPUs otimizadas.
Latência: Mesmo com hardware menos potente, a latência de modelos menores tende a ser menor.
Escalabilidade: É possível processar milhares de documentos simultaneamente com uma fração da energia e do custo de processamento necessários para modelos maiores, conforme explorado pelo blog técnico do Hugging Face.

Privacidade e Soberania de Dados sob a LGPD

A advocacia lida com o que há de mais sensível em termos de dados pessoais e segredo de justiça. O envio dessas informações para APIs de empresas estrangeiras levanta questões complexas de conformidade. Conforme discutido no debate sobre o Guia de Uso Ético da IA no Palácio da Justiça, a governança de dados é o pilar central da confiança tecnológica no Brasil.

A grande vantagem dos SLMs é a portabilidade. Por serem leves, eles permitem a instalação on-premises ou em nuvens privadas controladas. Isso significa que os dados do cliente nunca deixam o perímetro de segurança da organização. Essa arquitetura atende não apenas aos requisitos da LGPD, mas também às diretrizes do CNJ sobre a aplicabilidade prática da IA no Judiciário, que preza pela transparência e segurança.

O Contexto Brasileiro: Jurema e ARACI

Para o contexto do mercado jurídico nacional, a melhor estratégia não é apenas reduzir o tamanho do modelo, mas enriquecê-lo com os dados do Direito brasileiro. O desenvolvimento de tecnologias como o Jurema e o ARACI refletem essa necessidade de especialização.

Diferente de um modelo treinado majoritariamente em inglês e em legislações estrangeiras, as soluções da NeuralMind são treinadas e ajustadas em um corpus que compreende a legislação brasileira, a estrutura dos tribunais e a linguagem jurídica técnica do país.

Essa especialização reduz drasticamente o fenômeno das "alucinações" (quando a IA inventa leis ou jurisprudências), um risco inaceitável na prática jurídica profissional.

ARACI

O ARACI é uma nova plataforma que ajuda times jurídicos a saírem de uma operação fragmentada e reativa para um modelo mais conectado, rastreável e estratégico. Em vez de usar uma ferramenta para pesquisar, outra para escrever, outra para consultar documentos internos e outra para acompanhar dados, o ARACI concentra o fluxo jurídico em um único workspace conversacional. Assim, o ARACI realiza busca de jurisprudência e legislação, consulta de documentos internos, recupera argumentos de casos anteriores, redige peças e pareceres no estilo do escritório ou da empresa e rastreia a fonte de cada informação usada na resposta, tudo em um único software.

Por permitir a conexão da produção jurídica ao acervo, às diretrizes e à estratégia do cliente, a aplicação pode oferecer possibilidade de novos ganhos de produtividade, padronização, segurança e capacidade de gerar inteligência para o negócio.

Jurema

A família Jurema de LLMs foi criada pela NeuralMind em parceria com o Escavador e com apoio da FINEP para reunir modelos de linguagem feitos especificamente para o Direito brasileiro. O projeto foi desenvolvido para construir aplicações de diversas funções jurídicas: gerar peças e pesquisa jurídica, por exemplo. Por ser inteiramente treinado na legislação brasileira, é ideal para os profissionais do Direito no país.

Desde o ano passado, já é possível construir suas aplicações com a Jurema 7B, versão inicial open source dos modelos da família, disponibilizada na web. Agora, estamos lançando a API Jurema, com um modelo mais poderoso, desenvolvida para responder perguntas sobre o Direito brasileiro, analisar documentos e gerar resumos precisos de documentos e redação jurídica com consistência e suporte a fluxos especializados.

A Maturidade da Estratégia de IA

A transição dos LLMs generalistas para modelos especializados marca a fase de maturidade da Inteligência Artificial no mercado brasileiro. A tecnologia deixou de ser uma promessa experimental para se tornar uma ferramenta de engenharia de dados, focada em ROI (Retorno sobre Investimento) e segurança jurídica.

Adotar Small Language Models não é uma questão de abrir mão de potência, mas permite escolher a precisão para contextos específicos de uso da Inteligência Artificial Generativa. Para instituições que gerenciam grandes volumes de informações, a eficiência desses modelos é o caminho mais curto para uma justiça mais ágil e acessível.

Quer entender como implementar SLMs na sua operação jurídica? Conheça melhor as soluções jurídicas da NeuralMind e descubra como transformamos dados complexos em decisões inteligentes com segurança e soberania.