Edição de fotos movida a IA
Larissa Morimoto, growth manager da Photoroom, fala sobre a estratégia da startup francesa para crescer nesse mercado e aponta novos recursos que estão a caminho
30/10/202428/10/2020
Por redação AIoT Brasil
A área de IA do Facebook abriu o código fonte do modelo de tradução automática M2M-100, sua criação mais recente, que permite a versão automática multilíngue de 100 idiomas, sem depender da transposição prévia para o inglês. De acordo com os pesquisadores que desenvolveram o novo código, o M2M-100 é um passo importante no desafio de construir um modelo único que seja capaz de compreender todas as linguagens em diferentes tarefas, oferecer suporte a todos os idiomas e dialetos e criar novas experiências para bilhões de pessoas.
Até então, para traduzir do chinês para o francês, por exemplo, a maioria dos modelos multilíngues primeiro fazia a versão para o inglês e daí para o francês, porque os dados de aprendizado em inglês são os mais disponíveis. O M2M-100, contudo, traduz diretamente do chinês para o francês, o que proporciona a redução da possibilidade de falhas e uma precisão dez vezes maior, segundo o Facebook.
Atualmente, por meio dos desenvolvimentos recentes de versões automáticas, é gerada uma média de 20 bilhões de traduções no feed de notícias do Facebook, em bilhões de postagens em 160 idiomas. Os sistemas multilíngues avançados podem processar vários idiomas ao mesmo tempo, mas comprometem a precisão ao confiar nos dados em inglês para preencher a transposição entre os idiomas de origem e de destino e requerem a construção de modelos separados de IA para cada língua e cada tarefa. Na comunidade do Facebook, quase dois terços dos usuários falam idiomas diferentes do inglês, o que justificou a criação do novo modelo.
“Nosso modelo único multilíngue tem um desempenho tão bom quanto os modelos bilíngues tradicionais e obteve uma melhora de 10 pontos BLEU (BLEU é um algoritmo de avaliação da qualidade dos textos traduzidos automaticamente) em relação aos modelos multilíngues baseados no inglês. Usando novas estratégias de mineração para criar dados de tradução, construímos o primeiro conjunto de dados verdadeiramente ‘muitos para muitos’, com 7,5 bilhões de frases para 100 idiomas”, explicou o Facebook. Foram usadas ferramentas de mineração de dados de código aberto e várias técnicas de escalonamento para construir um modelo universal com 15 bilhões de parâmetros, que captura informações de idiomas relacionados.
Angela Fan, pesquisadora de IA do Facebook, explicou em uma postagem na rede que também foi utilizada a técnica conhecida como retrotradução para criar dados sintéticos que complementaram as informações paralelas já extraídas. “Continuaremos a aprimorar nosso modelo, incorporando pesquisas de ponta, explorando maneiras de implantar sistemas de tradução automática e criando arquiteturas de computação mais especializadas”, disse Fan.
#AI#aprendizado de máquina#BLEU#código aberto#IA#IA do Facebook#inteligência artificial#M2M-100#retrotradução#tradução automática
Larissa Morimoto, growth manager da Photoroom, fala sobre a estratégia da startup francesa para crescer nesse mercado e aponta novos recursos que estão a caminho
30/10/2024Novo app identifica golpes em mensagens, chamadas de vídeo e redes sociais, oferecendo mais segurança aos consumidores em tempo real
24/10/2024Plataforma Gale foi desenvolvida especialmente para empresas e promete reduzir em até 50% o tempo de criação de apps
23/08/2024