Google Tradutor se confunde com termos de significados contraditórios, diz estudo
As ferramentas de tradução do Google e de outras empresas podem estar contribuindo para uma grande má interpretação de termos jurídicos com significados conflitantes como "enjoin", afirma pesquisa que apresentada em um workshop acadêmico nesta segunda-feira.
O Google Tradutor transforma uma sentença em inglês sobre um tribunal proibindo violência, ou banindo-a, em uma frase na língua indiana de Kannada que dá a entender que a violência foi ordenada pelo tribunal, de acordo com o novo estudo.
A palavra "enjoin" pode se referir tanto a "promover" quanto a "restringir" uma ação. O Cambridge Dictionary explica que "enjoin", em um contexto jurídico, significa "proibir legalmente ou impedir algo por ordem de um tribunal". No entanto, em outras circunstâncias, o termo também pode significar "ordenar ou encorajar fortemente alguém a fazer algo".
O estudo diz que erros de tradução também surgem com outras palavras com significados contraditórios dependendo do contexto (chamadas "contrônimos"), incluindo "all over", "eventual" e "garnish".
O Google afirmou que sua ferramenta de tradução "ainda é apenas um complemento para a tradução profissional especializada", e que está "continuamente pesquisando melhorias, como uma forma mais adequada de lidar com a linguagem ambígua, para mitigar vieses e obter grandes ganhos de qualidade".
As descobertas do estudo contribuem para uma avaliação cuidadosa acerca das traduções automatizadas geradas por software de inteligência artificial. Pesquisadores descobriram anteriormente que programas que aprendem traduções estudando textos não diversos perpetuam preconceitos históricos de gênero, como associar profissionais de medicina a "ele".
O novo estudo levanta preocupações sobre um método popular que as empresas usam para ampliar o vocabulário de seus softwares de tradução. Eles traduzem textos estrangeiros para o inglês e depois traduzem o resultado de volta para a língua estrangeira, com o objetivo de ensinar o software a associar maneiras semelhantes de dizer a mesma frase.
Conhecido como "retrotradução", esse processo tem dificuldades com os "contrônimos", disse Vinay Prabhu, cientista-chefe da startup de autenticação UnifyID e um dos autores do artigo.
Quando eles traduziram uma sentença sobre um tribunal proibindo violência para 109 idiomas oferecidos pelo software do Google, a maioria dos resultados errou. Ao voltar as frases para o inglês, 88 retrotraduções disseram que o tribunal "ordenou" violência e apenas 10 disseram que o tribunal a "proibiu". O restante gerou outros erros.
O documento afirma que problemas de tradução podem levar a consequências graves, à medida que cada vez mais empresas usam IA para produzir ou traduzir textos jurídicos. Um exemplo citado na pesquisa é uma manchete de jornal sobre violência doméstica não letal, que transformou "agredido" em "morto" em uma tradução, uma associação potencialmente verdadeira porém problemática.
Os autores também expressaram preocupação com a falta de avisos e níveis de confiança nas ferramentas de tradução do Google e de outras empresas. Em materiais de suporte, o Google avisa que pode não ter a melhor versão "para traduções especializadas em suas próprias áreas".