A Nvidia demonstrou um novo algoritmo de inteligência artificial incrível que pode transformar automaticamente algumas fotos em uma cena 3D realista.
O algoritmo, que é baseado em uma rede neural de aprendizagem profunda, foi capaz de criar uma cena 3D a partir de apenas 12 fotos, renderizando em apenas alguns segundos. Os resultados ainda estão longe de ser perfeitos, mas impressionantes: e mostram a promessa de aplicações futuras em áreas como edição de vídeo e renderização de rostos, pessoas ou paisagens.
A Nvidia lançou um vídeo demonstrando o algoritmo em ação – confira você mesmo.
NERF instantâneo, a "mágica" 3D da Nvidia.
A ferramenta desenvolvida pela Nvidia é conhecida como Instant NERF, derivada de “campos de radiação neural”, uma técnica do Google Research e da UC San Diego University of California que foi lançada em 2020.
Se você realmente quer saber mais dê uma olhada aqui (Texto em inglês). Se, por outro lado, você estiver satisfeito com o que eu entendi: em essência, a técnica acopla os dados de cor e intensidade de luz de algumas imagens 2D para produzir uma cena 3D. De fato, além das fotografias, o sistema precisa de informações sobre a posição da câmera.
Os pesquisadores têm trabalhado na melhoria desse tipo de modelo de 2D para 3D há alguns anos, adicionando mais complexidade às renderizações e, ao mesmo tempo, reduzindo os tempos de resposta. Na verdade, a Nvidia afirma que seu novo método de renderização com Instant NeRF é talvez o mais rápido já criado: o procedimento vai de levar alguns minutos até ser concluído praticamente instantaneamente.
Possíveis campos de aplicação
À medida que a técnica se torna mais rápida e fácil de implementar, ela pode ser usada para todos os tipos de negócios, diz a Nvidia em um post no blog. descrevendo o trabalho.
O Instant NeRF pode ser usado para gerar avatares ou ambientes para mundos virtuais, capturar participantes de videoconferência e seus arredores em 3D ou recriar configurações para mapas digitais 3D, de acordo com Isha Salyan da Nvidia.
A tecnologia poderia ser usada para ensinar robôs e carros autônomos a identificar o tamanho e a forma de objetos do mundo real, tirando fotos 2D ou vídeos deles. Também será muito útil em arquitetura e entretenimento. Ajudará as startups (incluindo as italianas, como este) para criar representações digitais mais rápidas de ambientes reais que os criadores podem modificar e desenvolver em um flash.