Pesquisadores da Duke University desenvolveram uma ferramenta de inteligência artificial que pode transformar imagens borradas e irreconhecíveis do rosto das pessoas em retratos atraentes gerados por computador, com detalhes mais refinados do que nunca.
Os métodos anteriores ao Pulse GAN podiam detalhar uma imagem com pixels borrados até oito vezes sua resolução original. Mas a equipe de Duke descobriu uma maneira de pegar alguns pixels e criar rostos com aparência realista em até 64 vezes a resolução, “imaginando” recursos como linhas finas, cílios e rugas que não estavam presentes na primeira imagem.
Nenhuma imagem com esta resolução foi criada antes
Cynthia Rudin, cientista da computação, Duke University
Não é um identikit
O sistema Pulse GAN não pode ser usado para identificar pessoas, dizem os pesquisadores: não transformará uma foto borrada e irreconhecível de uma câmera de segurança em uma imagem nítida de uma pessoa real. Pelo contrário, é capaz de gerar novas faces que não existem, mas que parecem plausivelmente reais.
A mesma técnica poderia, em teoria, tirar fotos de baixa resolução de quase tudo e criar imagens nítidas e realistas, com aplicações que vão desde medicina e microscopia até astronomia e imagens de satélite, disse o coautor. Sachit Menon, dupla especialização em matemática e ciências da computação.
Os pesquisadores apresentarão seu método, chamado PULSO GAN, de amanhã a 19 de junho na conferência 2020 Computer Vision and Pattern Recognition (CVPR).
As abordagens tradicionais começam pegando uma imagem de baixa resolução com pixels borrados e “adivinhando” quais pixels extras são necessários, tentando fazê-los corresponder, em média, aos pixels correspondentes em imagens de alta resolução que o computador já viu antes. Como resultado desta média, as áreas texturizadas no cabelo e na pele que podem não se alinhar perfeitamente de pixel a pixel podem parecer desfocadas e indistintas.
A equipe da Duke adotou uma abordagem diferente
Em vez de obter uma imagem de baixa resolução e adicionar lentamente novos detalhes, o sistema procura exemplos de rostos de alta resolução gerados por IA (agora se tornar muito bom nisso), procurando aqueles que se assemelhem o máximo possível à imagem de entrada quando reduzidos ao mesmo tamanho.
A equipe usou uma ferramenta de aprendizado de máquina chamada GAN, ou “rede adversária generativa”. Falei sobre isso com mais profundidade neste artigo e em outros neste site. GANs são redes neurais treinadas no mesmo conjunto de dados fotográficos. Uma rede apresenta rostos humanos criados por IA que imitam aqueles para os quais foi treinada, enquanto a outra pega esse resultado e decide se ele é convincente o suficiente para ser confundido com uma foto real. A primeira rede fica cada vez melhor com a experiência, até que a segunda não consiga perceber a diferença. Eles competem entre si, em outras palavras, e, ao competir, se aperfeiçoam.
O PULSE pode criar imagens de aparência realista a partir de entradas barulhentas e de baixa qualidade. A partir de uma única imagem borrada de um rosto, ele pode emitir um número ilimitado de possibilidades realistas, cada uma das quais parece sutilmente diferente.
Mesmo com fotos pixeladas em que os olhos e a boca são quase irreconhecíveis, “nosso algoritmo pode fazer algo com isso. Algo que as abordagens tradicionais não podem fazer." Palavra do coautor Alex Damião, matemático da Duke.
Pulse GAN, “fantasia” no poder
O sistema pode converter um pixel borrado ou uma imagem de 16x16 pixels em uma imagem de 1024 x 1024 pixels em segundos, adicionando mais de um milhão de pixels, semelhante à resolução HD. Detalhes como poros, rugas e mechas de cabelo, imperceptíveis em fotos de baixa resolução, ficam nítidos e claros nas versões geradas por computador.
Os pesquisadores pediram a 40 pessoas para avaliar 1.440 imagens geradas via PULSE GAN e cinco outros métodos de dimensionamento. O julgamento deles? Um número em uma escala de um a cinco. e a Pulse GAN fez o melhor de tudo. Além do mais, ele marcou quase igual a fotos de alta qualidade de pessoas reais.
Veja os resultados você mesmo https://pulse.cs.duke.edu/.