Novos cursos de IA e IoT estão com inscrições abertas
Programa intensivo de IA para todos será realizado já nesta sexta-feira com duração de cinco horas
22/05/202507/07/2025
Por redação AIoT Brasil
Uma IA com sotaque brasileiro: assim pode ser definido o Gaia, um modelo de linguagem de código aberto desenvolvido por pesquisadores da Universidade Federal de Goiás(UFG) com o apoio do Google DeepMind e em parceria com outras instituições e empresas. Com base no multimodal Gemma 3 4B do Google, o Gaia foi criado por meio de pré-treinamento contínuo com um amplo conjunto de dados em português do Brasil, a fim de perceber mais profundamente as nuances do idioma e da cultura do país.
No treinamento e nas avaliações internas, de acordo com o Google DeepMind, o modelo obteve um desempenho superior ao lidar com questões do Enem e do benchmark de avaliação de similaridade semântica ASSIN-2, mesmo sem nenhum ajuste fino. ”O treinamento foi realizado em uma infraestrutura Nvidia DGX (Deep GPU Xceleration) com GPUs H100, processando um total de aproximadamente 13 bilhões de tokens”, informou o Google.
Na UFG, o projeto foi realizado pelo Centro de Excelência em Inteligência Artificial, sob a coordenação dos professores Celso Camilo e Sávio Teles, com a participação da Associação Brasileira de IA (Abria) e das startups Nama e Amadeus AI. Por enquanto, o Gaia está sendo aplicado pelo Tribunal de Contas dos Municípios de Goiás (TCM-GO) e disponibilizado gratuitamente na plataforma Hugging Face.
Marcelo de Oliveira, gerente de tecnologia do TCM-GO, observou: “O modelo Gaia tem uma característica que o torna mais detalhado, sem fugir do contexto principal e sem acrescentar detalhes não relacionados, o que costuma ser observado no modelo original”. O Google acrescentou que, além disso, o tamanho 4B permite a execução em hardware proprietário, o que reduz os custos de API.
Segundo o Google DeepMind, a criação do Gaia se justifica pelas dificuldades que os modelos de uso geral apresentam no entendimento linguístico e cultural necessário para conteúdo localizado, educação, atendimento ao cliente e outras aplicações comuns, devido à sub-representação em seus conjuntos de dados de treinamento iniciais. “Isso pode levar a traduções menos precisas, resultados culturalmente inconsistentes e à incapacidade de capturar o contexto completo das conversas em português brasileiro. Consequentemente, aplicativos desenvolvidos com base em modelos de uso geral podem apresentar desempenho inferior”, explicou.
Entre as organizações que planejam testar o Gaia estão o Centro de Estudos e Sistemas Avançados do Recife (Cesar), para ajudar professores de escolas públicas a corrigir redações de alunos, além da Unimed, a BHub e a BeNext.
#código aberto#Gaia#Google DeepMind#português#português do Brasil
Programa intensivo de IA para todos será realizado já nesta sexta-feira com duração de cinco horas
22/05/2025Programa gratuito dá prioridade a mulheres, integrantes da comunidade LGBTQ+ e a pessoas pretas e pardas, com deficiência e acima de 60 anos
19/05/2025Governo anunciou a introdução do curso no currículo de todos os níveis até o ensino médio para mostrar as aplicações no dia a dia
13/05/2025