Como funciona a nova "IA dubladora" do Google? Veja vídeo
Empresa diz estar ciente dos riscos que envolvem a tecnologia e a liberou apenas para parceiros autorizados
O Google anunciou nesta quarta-feira, 10, em seu principal evento do ano, o Google I/O, um novo serviço de tradução. O chamado "Universal Translator" utiliza inteligência artificial (IA) para traduzir vídeos para um novo idioma imitando o tom de voz da pessoa que está falando e alinhando o movimento dos lábios do apresentador com o das falas traduzidas.
Ao receber um vídeo — no exemplo, uma palestra de um curso online gravado por uma mulher em inglês —o Universal Translator trabalha em quatro estágios até a versão final. Primeiro, o áudio é identificado e transcrito. Depois a IA traduz o conteúdo para o idioma e, em seguida, gera um arquivo de áudio correspondente ao discurso no novo idioma, mantendo o mesmo estilo e tom de voz do original.
Por fim, o próprio algoritmo consegue editar a imagem do vídeo para que os movimentos dos lábios de quem fala fiquem sincronizados com o áudio no novo idioma. Assim, é como se a pessoa tivesse pronunciado palavras que nunca saíram, de fato, de sua boca.
Google announced extremely exciting news from Google I/O conference one of the important one is Universal Translator. You can translate your video recordings into different languages and the AI algorithm will match your lip movements with the target language. Here is an example. pic.twitter.com/Rhdm8d2D8N
— Muhammet R. Ertugrul (@imertugrul) May 11, 2023
O teste está sendo realizado em parceria com a Arizona State University e, segundo a empresa, é um enorme avanço na compreensão da aprendizagem e já apresentou resultados promissores com um aumento nas taxas de conclusão dos cursos.
A empresa disse estar consciente da "tensão" acerca do que estão considerando um "experimento", segundo o discurso de James Manyika, que lidera o novo departamento de "Tecnologia e Sociedade" da companhia. Isso porque a preocupação é que o serviço possa ser usado para criar deepfake, quando a IA é usada para combinar, substituir ou sobrepor áudios e imagens para criar arquivos falsos em que pessoas podem ser simuladas em qualquer situação.
"Você consegue ver o quanto (o serviço) pode ser benéfico, no entanto, algumas das mesmas tecnologias subjacentes podem ser utilizadas indevidamente por atores mal-intencionados para criar deepfakes", disse Manyika em seu discurso. Por isso, a empresa diz ter construído o serviço com "salvaguardas para ajudar a prevenir o uso indevido" e disponibilizou a novidade apenas para parceiros autorizados.