AIoT Brasil BRASIL INTELIGÊNCIA ARTIFICIALE INTERNET DAS COISAS

Fechar
A A

Tamanho fonte

* Foto: Segundo o Facebook, o M2M-100 é um passo importante para a criação do modelo capaz de compreender todas as línguas /Imagem Facebook

Por redação AIoT Brasil

A área de IA do Facebook abriu o código fonte do modelo de tradução automática M2M-100, sua criação mais recente, que permite a versão automática multilíngue de 100 idiomas, sem depender da transposição prévia para o inglês. De acordo com os pesquisadores que desenvolveram o novo código, o M2M-100 é um passo importante no desafio de construir um modelo único que seja capaz de compreender todas as linguagens em diferentes tarefas, oferecer suporte a todos os idiomas e dialetos e criar novas experiências para bilhões de pessoas.

Até então, para traduzir do chinês para o francês, por exemplo, a maioria dos modelos multilíngues primeiro fazia a versão para o inglês e daí para o francês, porque os dados de aprendizado em inglês são os mais disponíveis. O M2M-100, contudo, traduz diretamente do chinês para o francês, o que proporciona a redução da possibilidade de falhas e uma precisão dez vezes maior, segundo o Facebook.

Atualmente, por meio dos desenvolvimentos recentes de versões automáticas, é gerada uma média de 20 bilhões de traduções no feed de notícias do Facebook, em bilhões de postagens em 160 idiomas. Os sistemas multilíngues avançados podem processar vários idiomas ao mesmo tempo, mas comprometem a precisão ao confiar nos dados em inglês para preencher a transposição entre os idiomas de origem e de destino e requerem a construção de modelos separados de IA para cada língua e cada tarefa. Na comunidade do Facebook, quase dois terços dos usuários falam idiomas diferentes do inglês, o que justificou a criação do novo modelo.

“Nosso modelo único multilíngue tem um desempenho tão bom quanto os modelos bilíngues tradicionais e obteve uma melhora de 10 pontos BLEU (BLEU é um algoritmo de avaliação da qualidade dos textos traduzidos automaticamente) em relação aos modelos multilíngues baseados no inglês. Usando novas estratégias de mineração para criar dados de tradução, construímos o primeiro conjunto de dados verdadeiramente ‘muitos para muitos’, com 7,5 bilhões de frases para 100 idiomas”, explicou o Facebook. Foram usadas ferramentas de mineração de dados de código aberto e várias técnicas de escalonamento para construir um modelo universal com 15 bilhões de parâmetros, que captura informações de idiomas relacionados.

Angela Fan, pesquisadora de IA do Facebook, explicou em uma postagem na rede que também foi utilizada a técnica conhecida como retrotradução para criar dados sintéticos que complementaram as informações paralelas já extraídas. “Continuaremos a aprimorar nosso modelo, incorporando pesquisas de ponta, explorando maneiras de implantar sistemas de tradução automática e criando arquiteturas de computação mais especializadas”, disse Fan.

 

Mais populares

08/06/2021

99 usa IA para dar mais segurança às passageiras

Leia mais
10/06/2021

Duran Duran lança clipe feito por inteligência artificial

Leia mais
09/06/2021

Coreia do Sul recorre à IA para monitorar pesca ilegal

Leia mais
04/06/2021

Conheça o algoritmo da desinformação

Leia mais
30/10/2020

Alexa, abra La Casa de Papel, na Netflix...

Leia mais
break

Notícias Relacionadas