AiotAiot


LLM Amália tentará preservar o português de Portugal

Lançamento da versão beta do modelo com a nova variante linguística deverá ocorrer no primeiro trimestre deste ano

02/01/2025

LLM Amália tentará preservar o português de Portugal
Tamanho fonte

Por redação AIoT Brasil

Ainda no primeiro trimestre deste ano, o governo de Portugal deverá apresentar a versão beta de um grande modelo de linguagem (LLM) próprio, desenvolvido para preservar as características do idioma local e sua representatividade cultural. O nome escolhido não poderia ser mais apropriado: Assistente Multimodal Automático de Linguagem com Inteligência Artificial, que resultou na sigla “Amália”, em clara referência à cantora Amália Rodrigues, ícone do fado tradicional.

O LLM com a nova variante linguística foi anunciado pela primeira vez em novembro pelo primeiro-ministro Luís Montenegro, durante o Web Summit Lisboa, e agora surgiram novos detalhes do projeto e a confirmação do cronograma de desenvolvimento, com o lançamento da versão multimodal previsto para 2026. Para a criação do modelo treinado em “português de Portugal”, o governo autorizou um investimento de 5,5 milhões de euros, que se somam aos gastos já realizados em infraestrutura de computação, elaboração do projeto e contratação de profissionais especializados.

Foi estabelecido um calendário de trabalho e desenvolvimento de 18 meses, do qual resultará uma primeira versão multimodal do Amália, que será uma espécie de ChatGPT lusitano. O programa está sendo realizado exclusivamente com recursos públicos, no âmbito dos ministérios da Educação, Ciência e Inovação e da Juventude e Modernização, sem a participação de organizações privadas.

“É uma prioridade do governo português o desenvolvimento do primeiro LLM em língua portuguesa de Portugal”, afirmou o porta-voz do primeiro-ministro em comunicado divulgado no site oficial do governo. “O LLM português Amália permitirá contribuir para a preservação da soberania nacional, distinguir as diferentes variantes da língua portuguesa, reconhecer elementos da cultura e história de Portugal, permitir o controle dos dados utilizados para a sua aprendizagem e assegurar condições de armazenamento e utilização de dados sensíveis, como é o caso da maioria dos dados da administração pública”, acrescentou.

O treinamento do Amália está sendo executado por um consórcio liderado pelos centros de investigação Nova LINCS da Universidade Nova de Lisboa, Instituto de Telecomunicações e Instituto Superior Técnico, que integrarão outros centros de pesquisa portugueses. Até o final do terceiro trimestre de 2025 serão acrescidos ao treinamento da versão beta novos dados sobre a língua, a cultura e a história de Portugal, provenientes de fontes como o Arquivo.pt.

A partir daí será possível gerar respostas precisas e confiáveis, sem risco para o usuário. “Nesta altura, o Amália já poderá ser integrado a outras aplicações externas e utilizar dados dessas fontes para gerar respostas de texto. Todas as versões desenvolvidas serão disponibilizadas de forma gratuita e em open source, para que o Amália seja utilizado por todos, incluindo a academia, centros de investigação, entidades públicas, empresas e cidadãos”, explicou o governo português.

TAGS

#ChatGPT#dados sensíveis#grande modelo de linguagem#LLM#LLM Amália#português de Portugal

COMPARTILHE

Notícias Relacionadas