CTRL+C, CTRL+Voice: a revolução da clonagem vocal por IA
Inteligência artificial é capaz de clonar vozes humanas e enganar até mesmo os ouvidos mais atentos, como os de parentes e de amigos de alguém cuja voz foi copiada
06/09/2023
Tamanho fonte
Por Marcelo Bissuh*
Recentemente, viralizaram algumas publicações na internet mostrando como a inteligência artificial é capaz de clonar vozes humanas e enganar até mesmo os ouvidos mais atentos, como os de parentes e de amigos próximos de alguém cuja voz foi copiada.
Um exemplo disso foi o vídeo da jovem americana Mia Dio, que teve grande repercussão aqui no Brasil, em que ela revela como clonou a voz do namorado para tentar descobrir uma traição durante uma conversa com o melhor amigo do parceiro por telefone.
A semelhança impressionante com a voz real do sujeito suscitou milhares de comentários, motivo pelo qual a blogueira revelou ter realizado todo o processo por meio de um software simples chamado ElevenLabs, com um investimento de apenas U$4.
Outro vídeo interessante que circulou nas redes foi o do youtuber Felipe Castanhari explicando como a dublagem feita por IA pode vir a acabar com o trabalho dos dubladores no cinema mundial. Na gravação, o próprio Felipe tem a voz reproduzida em inglês e também a sua boca se move como se estivesse de fato falando o idioma. Tudo montado digitalmente.
Sim, é impossível não pensar no quanto isso é ‘Black Mirror’. No universo do entretenimento, o caminho parece ir mesmo neste sentido em um futuro próximo: atores renomados sendo compelidos a assinar cláusulas que permitam o uso de suas vozes e imagens para a reprodução em diversos idiomas por meio da IA. Seria uma oportunidade para os amantes dos filmes legendados mudarem de time?
Mas como a inteligência artificial consegue fazer isso? Explicando de forma simplificada: quando você realiza a gravação da sua voz no smartphone ou computador, sua frequência vocal é transformada em sinais elétricos durante a captura, que por sua vez são convertidos em 0s e 1s pela máquina, ou seja, dados digitais. É aí que a IA entra em ação com os seus algoritmos para reunir esses dados exatamente de acordo com objetivo para o qual a clonagem se propõe: seja traduzir uma língua, participar de um diálogo, cantar uma canção, entre outros…
Os usos benéficos das ferramentas de clonagem de voz são diversos: podem otimizar e facilitar o trabalho de milhares de profissionais da produção audiovisual e da criação de conteúdo. Uma única gravação, por exemplo, pode ser transformada e traduzida em inúmeros materiais e idiomas diferentes apenas pelo computador. O mesmo vale para um usuário que deseja criar um audiobook com a própria voz ou ainda, gravar um podcast sem necessariamente “tirá-lo do papel.”
Mas o questionamento em torno da regulação do uso de dados e da privacidade dos usuários dentro destas plataformas digitais ainda é uma pauta longe de ser resolvida. A falta de transparência das empresas de tecnologia somada à lacuna legal existente nas constituições e políticas de diversos países impedem que se tenha uma delimitação clara do que pode e o que não pode.
Enquanto isso, podemos utilizar como régua moral a máxima de não fazer com os outros aquilo que não gostaria que fizessem com você. Afinal, como você se sentiria se saíssem por aí clonando e utilizando a sua voz sem autorização? Vale o questionamento antes de manipular a voz de amigos e parentes nos aplicativos, mesmo com o intuito de uma simples ‘brincadeira’. Até porque, no caso de surgirem problemas sérios, como o crime de estelionato, por exemplo, não há previsibilidade das dimensões que tais situações negativas podem tomar.
*Marcelo Bissuh, CTO do TC, plataforma social para investidores com educação financeira, análise de dados e inteligência de mercado