Script = https://s1.trrsf.com/update-1725976688/fe/zaz-ui-t360/_js/transition.min.js
PUBLICIDADE

Inteligência artificial "apaga" edifícios inteiros de imagens ao vivo

O sistema de aprendizagem de máquina usa redes generativas adversárias para remover construções virtualmente de uma paisagem

4 ago 2022 - 11h39
(atualizado às 13h24)
Compartilhar
Exibir comentários

Pesquisadores da Universidade de Osaka, no Japão, desenvolveram um novo sistema de aprendizagem de máquina capaz de remover edifícios virtualmente de uma imagem ao vivo. Basta apontar o tablet ou celular para a paisagem para que o algoritmo apague o prédio do cenário.

Segundo os cientistas, essa "demolição" virtual é possível graças ao uso de redes generativas adversárias (GAN, na sigla em inglês) executadas em um servidor remoto e depois transmitidas em tempo real para um dispositivo móvel que pode estar a quilômetros de distância.

"Nosso método permite que os usuários entendam intuitivamente como será o cenário futuro, contribuindo para reduzir drasticamente o tempo e o custo para formar um consenso sobre a demolição real o que, geralmente, envolve a participação de várias partes interessadas", explica o professor de engenharia civil Takuya Kikuchi, autor principal do estudo.

Streaming do futuro

Para gerar uma imagem em realidade aumentada, que pudesse ser exibida em tempo real por qualquer dispositivo móvel, todo o processamento é feito remotamente por um servidor dedicado. Isso garante que equipamentos comuns possam ser usados no local onde está o edifício que será apagado virtualmente.

Foto: saoirse2010/Envato / Canaltech

Como é preciso acelerar o algoritmo para que ele possa renderizar uma imagem ao vivo, os pesquisadores utilizaram uma técnica conhecida como segmentação semântica. Esse método permite que o modelo de aprendizado profundo classifique as imagens pixel a pixel, ao contrário de sistemas convencionais que fazem essa detecção usando objetos em 3D.

"Os algoritmos GAN usam duas redes neurais concorrentes, uma geradora e outra discriminadora. A geradora é treinada para criar imagens mais realistas, enquanto a discriminadora distingue se a imagem é real ou produzida artificialmente. Ao aprender dessa maneira, o algoritmo pode criar imagens que não existem, mas são plausíveis", acrescenta o professor de engenharia ambiental Tomohiro Fukuda.

Limitações

No protótipo desenvolvido pelos cientistas, o processamento de alta precisão se mostrou totalmente viável desde que o edifício a ser removido da paisagem não ultrapasse 15% da tela. Se esses parâmetros forem mantidos, o vídeo da demolição virtual pode ser transmitido a uma taxa média de 5,71 quadros por segundo.

Porém, se o elemento a ser apagado virtualmente ocupar uma área maior, ocorrem distorções na imagem, gerando uma espécie de "fantasma" do edifício eliminado pela ferramenta. Esse fenômeno pode causar distorções significativas, comprometendo o resultado da amostra.

"Essa a primeira versão de nossa ferramenta para remoção digital de construções em tempo real. No futuro, queremos aperfeiçoar o processamento e ampliar o limite de tamanho do objeto a ser removido, para que o sistema possa ser usado efetivamente em ações de planejamento urbano", encerra o professor Takuya Kikuchi.

Trending no Canaltech:

Canaltech
Compartilhar
Publicidade
Seu Terra












Publicidade