Inteligência Artificial que copia vozes pode remover sotaques e inverter gêneros
A chinesa Baidu revelou que o seu sistema de Inteligência Artificial Deep Voice acaba de se tornar ainda mais inteligente. Segundo a companhia, agora ele é capaz de clonar rapidamente a voz de qualquer pessoa, além de alterar os seus sotaques ou inverter o gênero.
Lançado no ano passado, o Deep Voice já conseguia copiar a voz dos usuários, mas levava cerca de 30 minutos para isso. Agora, com a mais nova evolução do sistema, esse trabalho pode ser concluído em apenas poucos segundos.
A equipe de pesquisas da Baidu revelou, em publicação no blog oficial da companhia, que dois métodos de treinamento foram aplicados para que a IA pudesse concluir seu objetivo. No primeiro, uma voz mais real é gerada com mais qualidade, mas com a necessidade da entrada de um áudio adicional; no segundo, a voz clonada é gerada de forma mais rápida, mas com menos qualidade.
Os pesquisadores também contam que, com mais algoritmos ajustados e dados mais amplos, é possível aprimorar a tecnologia ainda mais.
Os áudios clonados podem ser ouvidos em uma página criada no GitHub, que conta com diversas amostras, destacando em negrito as mais bem-sucedidas.