Estes programas criam qualquer imagem que você quiser
Algoritmos de geração de imagem por texto estão se popularizando em empresas como Google e TikTok; conheça o que temos hoje
Você já deve ter ouvido falar que algoritmos podem ser usados para criar músicas, ilustrações e outros tipos de arte. Acontece que, agora, estamos em uma nova era da inteligência artificial (IA). Várias ferramentas produzem imagens a partir de comandos de textos – basta escrever o que você quer que tenha na sua criação.
Há artistas que já estão odiando essa novidade. Andres Guadamuz, estudante de direito de propriedade intelectual na Universidade de Sussex, no Reino Unido, tem estudado questões legais em torno da arte gerada pela IA. Recentemente, ele usou um serviço chamado Midjourney para criar imagens assustadoras, semelhantes às feitas pelo artista Stålenhag.
Stalenhag, por sua vez, já tinha criticado a arte produzida por IAs, e mais uma vez não ficou muito feliz com a situação. Em seu Twitter, o artista comentou que usar elementos de outros artistas é uma “pedra angular de uma cultura artística viva", mas que no caso da IA, as grandes empresas de tecnologia querem nos alimentar com uma massa derivada e generalizada, que é a visão delas de futuro, e roubando décadas de trabalho artístico sem consentimento.
De qualquer forma, não podemos negar que o conceito é impressionante e pode trazer ferramentas com grande potencial criativo, para o bem e para o mal, como veremos nos casos abaixo.
AI Greenscreen, do TikTok
Uma dessas novas ferramentas é a AI Greenscreen, do TikTok, classificada como um sistema de IA texto-para-imagem. Basta escrever o que quiser ver ilustrado que o software vai criar. Por exemplo: “Astronauta no oceano”. Talvez não fique tão perfeito quanto você imagina, mas no mínimo você vai ver uma junção de elementos que remetem ao que está escrito.
O sistema do TikTok ainda é básico se comparado com outros sistemas já existentes de IA com a mesma proposta, porque ele cria imagens bastante abstratas ou giratórias. Outros modelos mais avançados são capazes de produzir imagens fotorrealistas e ilustrações complexas que parecem, de fato, ter sido feitas por humanos.
Mas, ao que parece, as limitações da IA do TikTok podem ser intencionais. Primeiro, porque modelos mais avançados exigem maior poder de computação, o que poderia ser caro para a empresa; segundo, porque dar o poder dos mais de um bilhão de usuários da plataforma para criar imagens fotorrealistas de qualquer coisa que eles possam imaginar pode ser preocupante.
Ao testarem a capacidade da IA para produzir imagens associadas ao gore, violência e nudez, James Vincent, jornalista do site "The Verge", mostrou que a ferramenta pareceu de fato bem abstrata e inexata. Porém, só pelo TikTok estar promovendo esse tipo de iniciativa é um indicativo de que a IA está se popularizando muito.
DALL-E, a pioneira
Responsável por dar o pontapé inicial na área, a DALL-E surgiu em janeiro de 2021, anunciada pela empresa OpenAI. O programa, que vem tendo melhorias, agora já conta com uma segunda versão: o DALL-E 2, anunciada em abril deste ano.
A novidade promete gerar fotos, ilustrações e pinturas que parecem ter sido feitas por humanos. A OpenAI também disse que qualquer um poderia usar a tecnologia, e que em breve ela também estaria disponível para fins comerciais.
A OpenAI restringe o que os usuários podem fazer com a ferramenta, usando filtros de palavras-chave e ferramentas capazes de identificar imagens consideradas como ofensivas.
O artista RJ Palmer, especialista em desenhar criaturas fantásticas, que trabalhou como artista conceitual no filme "Detetive Pikachu", disse ao site Wired que a curiosidade o levou a experimentar a DALL-E 2, mas fica preocupado com o que essas novas tecnologias podem significar para a profissão dele.
Imagen, do Google
Depois da DALL-E, o Google anunciou sua jogada: o Imagen, que desbancou o DALL-E em qualidade de produção. Você pode ver algumas das imagens acima e notar a coerência do comando com a fotografia gerada.
Mas lembre-se: normalmente, quando o Google lança um produto, ele mostra os melhores resultados. Então pode ser que essas imagens não correspondam à saída média da ferramenta. Muitas vezes, elas podem parecer inacabadas, manchadas ou embaçadas, problemas que já vinham aparecendo no DALL-E.
Porém, o Google afirma que a IA deles produz imagens consistentemente melhores que as do DALL-E 2, inclusive, com base em um novo benchmark (ponto de referência) criado para esse projeto, chamado DrawBench.
O DrawBench é uma lista de 200 solicitações de texto que a equipe do Google usou para alimentar o Imagen. Apesar do potencial criativo, o Google ainda não disponibilizou o modelo Imagen ao público, pois eles podem ser usados com finalidades escusas, como notícias falsas, assédio, farsas etc. Além disso, os sistemas codificam preconceitos, como racismo, sexismo e outros problemas sociais.
A própria conclusão do Google é que a Imagen "não é adequada para uso público neste momento", e a empresa diz que planeja desenvolver uma nova maneira de testar futuras maneiras de corrigir os preconceitos que a tecnologia reproduz.
Midjourney
A empresa Midjorney, de David Holz, a partir de um laboratório de dez pessoas, criou um gerador de imagem de IA que pode ser acessado por um servidor de chat do Discord. Para gerar suas próprias imagens, basta entrar no Discord da Midjourney, digitar um comando, e o sistema fará uma imagem para você.
Holz já disse ao "The Verge" que o objetivo de criar a ferramenta no Discord é que “as pessoas querem fazer coisas juntas”, então não faria sentido por exemplo criar simplesmente um app para IOS. O serviço é pago, no entanto.
A Midjourney está querendo expandir o acesso ao seu modelo, fazendo com que qualquer um possa criar seu próprio servidor na Discord e ter seu próprio gerador de imagem por IA.
“Não achamos que seja realmente sobre arte ou fazer deepfakes, mas — como expandimos os poderes imaginativos da espécie humana? E o que isso significa? O que significa quando computadores são melhores em imaginação visual do que 99% dos humanos? Isso não significa que vamos parar de imaginar”, comentou Holz a "The Verge".
E completa: “Os carros são mais rápidos que os humanos, mas isso não significa que paramos de andar. Quando estamos movendo grandes quantidades de coisas em grandes distâncias, precisamos de motores, sejam aviões, barcos ou carros. E vemos essa tecnologia como um motor para a imaginação. Então é uma coisa muito positiva e humanista”.