AiotAiot


Google lança IA desenvolvida por pesquisadores brasileiros

Modelo de código aberto Gaia foi criado na Universidade Federal de Goiás para melhor compreensão do português falado no país

07/07/2025

Google lança IA desenvolvida por pesquisadores brasileiros
Tamanho fonte

Por redação AIoT Brasil

Uma IA com sotaque brasileiro: assim pode ser definido o Gaia, um modelo de linguagem de código aberto desenvolvido por pesquisadores da Universidade Federal de Goiás(UFG) com o apoio do Google DeepMind e em parceria com outras instituições e empresas. Com base no multimodal Gemma 3 4B do Google, o Gaia foi criado por meio de pré-treinamento contínuo com um amplo conjunto de dados em português do Brasil, a fim de perceber mais profundamente as nuances do idioma e da cultura do país.

No treinamento e nas avaliações internas, de acordo com o Google DeepMind, o modelo obteve um desempenho superior ao lidar com questões do Enem e do benchmark de avaliação de similaridade semântica ASSIN-2, mesmo sem nenhum ajuste fino. ”O treinamento foi realizado em uma infraestrutura Nvidia DGX (Deep GPU Xceleration) com GPUs H100, processando um total de aproximadamente 13 bilhões de tokens”, informou o Google.

Na UFG, o projeto foi realizado pelo Centro de Excelência em Inteligência Artificial, sob a coordenação dos professores Celso Camilo e Sávio Teles, com a participação da Associação Brasileira de IA (Abria) e das startups Nama e Amadeus AI. Por enquanto, o Gaia está sendo aplicado pelo Tribunal de Contas dos Municípios de Goiás (TCM-GO) e disponibilizado gratuitamente na plataforma Hugging Face.

Marcelo de Oliveira, gerente de tecnologia do TCM-GO, observou: “O modelo Gaia tem uma característica que o torna mais detalhado, sem fugir do contexto principal e sem acrescentar detalhes não relacionados, o que costuma ser observado no modelo original”. O Google acrescentou que, além disso, o tamanho 4B permite a execução em hardware proprietário, o que reduz os custos de API.

Segundo o Google DeepMind, a criação do Gaia se justifica pelas dificuldades que os modelos de uso geral apresentam no entendimento linguístico e cultural necessário para conteúdo localizado, educação, atendimento ao cliente e outras aplicações comuns, devido à sub-representação em seus conjuntos de dados de treinamento iniciais. “Isso pode levar a traduções menos precisas, resultados culturalmente inconsistentes e à incapacidade de capturar o contexto completo das conversas em português brasileiro. Consequentemente, aplicativos desenvolvidos com base em modelos de uso geral podem apresentar desempenho inferior”, explicou.

Entre as organizações que planejam testar o Gaia estão o Centro de Estudos e Sistemas Avançados do Recife (Cesar), para ajudar professores de escolas públicas a corrigir redações de alunos, além da Unimed, a BHub e a BeNext.

TAGS

#código aberto#Gaia#Google DeepMind#português#português do Brasil

COMPARTILHE

Notícias Relacionadas