Futurecom 2024 começa hoje em SP: o que esperar do evento
Congresso de inovação e tecnologia tem como tema central a conectividade e as novas relações entre pessoas e máquinas
08/10/202416/08/2024
Por Ricardo Marques da Silva
Em um novo estudo, pesquisadores do Instituto de Tecnologia de Massachusetts (MIT, na sigla em inglês) descobriram que grandes modelos de linguagem (LLMs) têm o potencial de detectar anomalias em sistemas complexos, como redes de satélites, grandes indústrias e parques eólicos, de forma mais eficiente do que com o uso de métodos convencionais. De acordo com a pesquisa, divulgada nesta semana, a estrutura chamada SigLLM inclui um componente que converte dados de séries temporais em entradas baseadas em texto que um LLM pode processar, sem treinamento.
Em relação ao contexto de aplicação, os cientistas lembraram que identificar uma turbina defeituosa em um parque eólico, por exemplo, “é como encontrar uma agulha no palheiro”, quando se considera que a tarefa pode envolver a análise de centenas de sinais e milhões de dados. Em geral, os engenheiros simplificam esse problema complexo usando modelos de aprendizado profundo que podem detectar problemas em medições feitas repetidamente ao longo do tempo em cada turbina, conhecidas como dados de séries temporais.
“Mas, com centenas de turbinas eólicas registrando dezenas de sinais a cada hora, treinar um modelo de aprendizado profundo para analisar dados de séries temporais é oneroso e trabalhoso. Esse desafio é agravado pelo fato de que o modelo precisará ser retreinado após a implantação, e os operadores de parques eólicos podem não ter a expertise necessária em aprendizado de máquina”, explicou o MIT, em artigo publicado em seu site.
Com o SigLLM, torna-se possível alimentar o sistema com os dados preparados para o modelo e pedir para que comece a identificar anomalias. “Embora não superassem os modelos de aprendizado profundo de última geração na detecção de anomalias, os LLMs tiveram um desempenho tão bom quanto algumas outras abordagens de IA. Se os pesquisadores puderem melhorar o desempenho dos LLMs, essa estrutura pode ajudar os técnicos a sinalizar problemas potenciais em equipamentos como máquinas pesadas ou satélites antes que eles ocorram, sem a necessidade de treinar um modelo caro de aprendizado profundo”, explicaram os cientistas.
“Como essa foi apenas a primeira iteração, não esperávamos chegar lá neste momento, mas esses resultados mostram que há uma oportunidade aqui de alavancar LLMs para tarefas complexas de detecção de anomalias”, disse Sarah Alnegheimish, principal autora do artigo sobre o estudo do SigLLM. A pesquisa do MIT será apresentada na Conferência do IEEE sobre Ciência de Dados e Análise Avançada, em outubro, em San Diego, nos Estados Unidos.
#grandes modelos de linguagem#LLM#MIT#parque eolico
Congresso de inovação e tecnologia tem como tema central a conectividade e as novas relações entre pessoas e máquinas
08/10/2024Pesquisa do Gartner indica que a maioria dos recursos deverá ser aplicada em IA, IA generativa e segurança cibernética
01/10/2024Conferência de dois dias dedicada a desenvolvedores apresentará as novidades da empresa e poderá ser assistida online
25/09/2024