A Nvidia demonstrou um novo algoritmo de inteligência artificial incrível que pode transformar automaticamente algumas fotos em uma cena 3D realista.
O algoritmo, que é baseado em uma rede neural de aprendizado profundo, foi capaz de criar uma cena 3D a partir de apenas 12 fotos, renderizando-a em segundos. Os resultados ainda estão longe de serem perfeitos, mas surpreendentes: e mostram a promessa de futuras aplicações em áreas como edição de vídeo e renderização de rostos, pessoas ou paisagens.
A Nvidia lançou um vídeo demonstrando o algoritmo em ação - confira você mesmo.
NERF instantâneo, a "mágica" 3D da Nvidia
A ferramenta desenvolvida pela Nvidia é conhecida como Instant NERF, derivada de “neural radiance fields”, uma técnica do Google Research e da UC San Diego University of California que foi lançada em 2020.
Se você realmente quer saber mais dê uma olhada aqui (Texto em inglês). Se, por outro lado, você estiver satisfeito com o que eu entendi: em essência, a técnica acopla os dados de cor e intensidade de luz de algumas imagens 2D para produzir uma cena 3D. De fato, além das fotografias, o sistema precisa de informações sobre a posição da câmera.
Os pesquisadores vêm trabalhando para melhorar esse tipo de modelo de 2D para 3D nos últimos dois anos, adicionando mais complexidade às renderizações e reduzindo o tempo. Na verdade, a Nvidia afirma que seu novo método de renderização com Instant NeRF é talvez o mais rápido já criado: o procedimento vai de alguns minutos para ser concluído praticamente instantaneamente.

Possíveis campos de aplicação
À medida que a técnica se torna mais rápida e fácil de implementar, ela pode ser usada para todos os tipos de negócios, diz a Nvidia em um post no blog. descrevendo o trabalho.
O Instant NeRF pode ser usado para gerar avatares ou ambientes para mundos virtuais, capturar participantes de videoconferência e seus arredores em 3D ou recriar configurações para mapas digitais 3D, de acordo com Isha Salyan da Nvidia.
A tecnologia pode ser usada para ensinar robôs e carros autônomos a identificar o tamanho e a forma de objetos do mundo real, tirando fotos ou filmes em 2D deles. Também será muito útil em arquitetura e entretenimento. Ele ajudará startups (também italianas, como este) para criar representações digitais mais rápidas de ambientes reais que os criadores podem modificar e desenvolver em um flash.