AiotAiot


Nova IA faz clonagem de voz com rapidez e precisão

OpenVoice foi desenvolvido por meio de uma parceria entre a startup canadense MyShell, o MIT e a Universidade de Tsinghua

04/01/2024

Nova IA faz clonagem de voz com rapidez e precisão
Tamanho fonte

Por Ricardo Marques da Silva

A startup canadense MyShell anunciou o lançamento de uma solução de inteligência artificial de código aberto que permite a clonagem de voz com “velocidade e precisão sem precedentes”, de acordo com a empresa. Batizado de OpenVoice, o aplicativo foi desenvolvido por meio de uma parceria que envolveu pesquisadores do Instituto de Tecnologia de Massachusetts (MIT) e da Universidade Tsinghua, de Pequim, na China, e requer apenas alguns segundos de áudio para clonar uma voz em vários idiomas, com controle de tom, emoção, sotaque e ritmo.

Para chegar a esse resultado, foram utilizados dois modelos de IA que trabalham em conjunto para a conversão de texto em fala e clonagem de tom de voz. O primeiro lida com estilos de linguagem, sotaques, emoções e outros padrões de fala e compreende aproximadamente 30 mil amostras de áudio em inglês, chinês e japonês. O segundo modelo, de conversor de tons, foi treinado com mais de 300 mil amostras de 20 mil vozes. Ao combinar os dois modelos, o OpenVoice pode clonar vozes com poucos dados e mais rapidamente do que soluções semelhantes, como o Voicebox da Meta.

A MyShell disse que a decisão de abrir o código do OpenVoice cumpre o objetivo de oferecer “inteligência artificial para todos”. Por isso, ao anunciar o lançamento, a startup divulgou o relatório técnico e o código-fonte do algoritmo, para uso geral. Além disso, a empresa liberou um link para que os usuários possam testar o OpenVoice, gratuitamente, e clonar a própria voz.

A MyShell foi fundada em 2023 em Calgary, com um investimento inicial de US$ 5,6 milhões liderado pela INCE Capital e aportes adicionais da Folius Ventures, Hashkey Capital, SevenX Ventures, TSVC e OP Crypto. Conta atualmente com mais de 400 mil usuários e se descreve como uma “plataforma descentralizada e abrangente para descobrir e criar aplicativos nativos de IA”.

Segundo matéria publicada no portal VentureBeat, além do OpenVoice, a MyShell oferece um aplicativo como uma série de diferentes personagens de IA baseados em textos e bots semelhantes ao Character.AI. Como modelo de negócio, a startup cobra uma assinatura mensal dos usuários do seu aplicativo web e de criadores de bots terceirizados que querem promover seus produtos. Também cobra pelos dados de treinamento de IA.

TAGS

#clonagem de voz#código aberto#inteligência artificial#MyShell#OpenVoice

COMPARTILHE

Notícias Relacionadas