VASA-1, IA da Microsoft cria personagens super-realistas a partir de apenas uma foto

Abril 19 2024

Tecnologia

VASA-1, o revolucionário modelo de IA da Microsoft, leva os rostos falantes gerados por computador a um novo nível de realismo.

comparatilhe

O tempo dos assistentes de IA está cada vez mais próximo: a interface com rostos e avatares digitais está rapidamente a tornar-se parte integrante da nossa vida quotidiana. Até onde podem ir esses rostos digitais para replicar o realismo de uma pessoa real? Muito longe, a julgar pelo VASA-1, o modelo inovador de inteligência artificial desenvolvido recentemente pela Microsoft Research. Aqui você encontra o papel.

VASA-1 pode gerar vídeos ultra-realistas de rostos falantes em tempo real a partir de uma única imagem e um arquivo de áudio. Irá ultrapassar os limites do que é possível na criação de avatares digitais, com aplicações que vão desde videochamadas a conteúdos de entretenimento, até à melhoria da acessibilidade para pessoas com deficiência auditiva.

VASA-1, realismo sem precedentes

O que torna o VASA-1 verdadeiramente revolucionário é o nível de realismo que é capaz de alcançar. Os vídeos gerados por este modelo de IA são virtualmente indistinguíveis daqueles de pessoas reais.

Isto é possível graças a uma série de recursos inovadores. Em primeiro lugar, VASA-1 oferece sincronização perfeita entre movimentos labiais e áudio. Independentemente do idioma ou da presença de ruído de fundo, os lábios do avatar se movem em perfeita sincronia com as palavras faladas, criando um efeito de realismo surpreendente.

Além disso, o VASA-1 é capaz de capturar e reproduzir uma ampla gama de expressões faciais, das nuances mais sutis às emoções mais marcantes. Isso adiciona um nível extra de profundidade e autenticidade aos avatares gerados e ao “pessoas digitais".

Finalmente, os movimentos da cabeça são gerados de forma natural e fluida, contribuindo para a impressão de estar diante de uma pessoa real e não de uma imagem estática.

Geração em tempo real e alta qualidade

Acho impressionante a capacidade do VASA-1 de gerar esses vídeos ultra-realistas em tempo real. Atualmente tem resolução de 512x512 pixels e velocidade de até 40 frames por segundo, mas são avatares que falam ao vivo, sem atrasos ou interrupções.

Isso abre caminho para uma série de aplicações inovadoras. Por exemplo, o VASA-1 poderia ser usado para criar avatares personalizados para videochamadas, tornando as interações virtuais mais envolventes e realistas. Também pode ser usado para gerar personagens interativos em videogames ou para criar conteúdo de vídeo educativo e divertido com apresentadores virtuais.

Rumo a uma maior acessibilidade

Uma das aplicações potenciais mais interessantes do VASA-1 envolve acessibilidade. Ao gerar vídeos de rostos falantes a partir de um arquivo de áudio, este modelo de IA poderia ser usado para criar versões acessíveis de conteúdo de vídeo para pessoas com deficiência auditiva.

Imagine poder assistir a um discurso ou palestra com um avatar de palestrante articulando claramente as palavras em sincronia com o áudio. Isto poderia tornar os conteúdos muito mais utilizáveis para pessoas com dificuldades auditivas, abrindo novas possibilidades de aprendizagem e participação.

Peço desculpas em nome da Microsoft :)

O futuro do VASA-1 e da comunicação virtual

Os pesquisadores da Microsoft não estão satisfeitos e já estão trabalhando para melhorar ainda mais o desempenho do VASA-1. No futuro, podemos esperar avatares falantes de qualidade ainda maior, ainda mais suaves e com resoluções mais altas. Sem falar nos tempos e custos de filmes e animações: eles serão totalmente alterados.

Vocês se lembram da série de TV pioneira "Max Headroom“? Lá, um verdadeiro jornalista foi “ressuscitado” como um avatar virtual. Uma série visionária, de 30 anos atrás, que em breve será totalmente superada pelos fatos. À medida que a VASA-1 e tecnologias semelhantes avançam, a linha entre a comunicação virtual e a interação face a face pode tornar-se cada vez mais ténue.

É claro que esta perspectiva também levanta questões éticas e sociais. Será importante desenvolver diretrizes e regulamentos para garantir o uso responsável e transparente destas tecnologias, protegendo a privacidade e prevenindo potenciais abusos, como a criação de deepfakes.

Dito isto, os benefícios potenciais de modelos como o VASA-1 são enormes.

Da comunicação mais envolvente à aprendizagem melhorada, do entretenimento mais interativo à maior acessibilidade, as aplicações são vastas e promissoras.

VASA-1 oferece-nos um vislumbre fascinante de um futuro em que a comunicação virtual será cada vez mais indistinguível da comunicação presencial. É um futuro onde avatares ultra-realistas podem transmitir não apenas palavras, mas também emoções, expressões e presença. Um futuro onde a distância física será uma barreira menor e onde a acessibilidade ao conteúdo será muito melhorada.

Estou muito curioso para ver como o VASA-1 (e seus sucessores) transformará a maneira como nos comunicamos, aprendemos e nos divertimos nos próximos anos. A revolução do rosto digital apenas começou e o futuro parece mais realista do que nunca.

Gianluca Riccio, diretora criativa da Melancia adv, redatora e jornalista. Faz parte do Instituto Italiano para o Futuro, World Future Society e H+. Desde 2006 dirige Futuroprossimo.it, o recurso italiano de Futurologia.

Para relatar pesquisas, descobertas e invenções, entre em contato com a equipe editorial! Siga Futuro Próssimo no Whatsapp: notícias e atualizações exclusivas (gratuitas).

FP em Fatto Quotidiano
Alberto Robiati e Gianluca Riccio guiam os leitores através de cenários do futuro: as oportunidades, riscos e possibilidades que temos para criar um amanhã possível.

No mesmo tópico:

O último

VASA-1, IA da Microsoft cria personagens super-realistas a partir de apenas uma foto

Tecnologia

comparatilhe

VASA-1, realismo sem precedentes

Geração em tempo real e alta qualidade

Rumo a uma maior acessibilidade

O futuro do VASA-1 e da comunicação virtual

Dito isto, os benefícios potenciais de modelos como o VASA-1 são enormes.

Armas autônomas, a conferência de Viena: “agir agora para proteger a humanidade”

Osteoartrite, exame de sangue com IA supera os raios X e prevê isso 10 anos antes

Vou levá-lo ao futuro do entretenimento “automatizado” e gerado por IA

Ayrton Senna, 30 anos depois: seu fim trágico mudou o futuro da F1

Armas autônomas, a conferência de Viena: “agir agora para proteger a humanidade”

Agricultura vertical: quanto você sabe? 4 mitos para dissipar

Da varredura corporal ao relaxamento: RO, o colete robótico que acalma seus nervos

Estrume de gado transforma resíduos médicos em composto: estudo indiano