Um novo dispositivo vestível desenvolvido por cientistas da Universidade de Cornell é capaz de capturar as expressões faciais de uma pessoa usando um sonar e reproduzi-las como um avatar digital. Evitar câmeras pode mitigar as preocupações com a privacidade.
EarIO, esse é o nome do aparelho, é hiper simples. É composto por um fone de ouvido com microfone e um alto-falante de cada lado, podendo ser conectado a qualquer fone de ouvido normal. Os alto-falantes reproduzem pulsos sonoros fora do alcance da audição humana e seus ecos são captados por microfones, assim como funciona o sonar.
Os perfis de eco mudam dependendo das expressões faciais: por esta razão, algoritmos devidamente treinados reconhecem as variações recebidas do sonar e as traduzem em imagens.
EarlO, sonar que “vê” coisas a partir de sons
“Graças ao poder da inteligência artificial, nosso algoritmo constrói conexões intrincadas entre movimentos musculares e expressões faciais que os humanos não conseguem perceber”, diz ele. Ke Li, um dos coautores do estudo. “Ele pode ser usado para extrair informações muito complexas: de toda a parte frontal do rosto.” A pesquisa foi publicada na revista Anais da Association for Computing Machinery on Interactive, Mobile, Wearable and Ubiquitous Technologies. E eu te linko aqui.
A equipe testou o sonar EarIO em 16 participantes, executando o algoritmo em um smartphone comum. E o dispositivo foi capaz de reconstruir expressões faciais como uma câmera/câmera de vídeo normal faria. Ruídos de fundo, como vento, conversas ou barulho da rua, não interferiram em nada na capacidade de registrar rostos.
Tecnologia de 007
Os pesquisadores destacam que o sonar tem diversas vantagens em relação ao uso de um câmera. Os dados acústicos consomem muito menos energia e capacidade de processamento, permitindo que você use dispositivos menores e mais leves. As câmeras também podem coletar muitas informações pessoais adicionais que os usuários podem não querer compartilhar, então o sonar pode ser mais seguro.
Claro, voando com a imaginação imagino uma tecnologia como essa silenciosamente “presa” em um fone de ouvido normal, e acho que ela pode transmitir remotamente movimentos e expressões labiais também para fins de vigilância. Desta vez, porém, vejo usos mais práticos para isso.
Qual? Em primeiro lugar, os do setor de jogos: uma forma prática de replicar expressões faciais físicas em um avatar digital para jogos, realidade virtual ou metaverso. Agora a equipe trabalha para excluir outras interferências, como quando o usuário vira a cabeça, e simplificar o sistema de treinamento do algoritmo de IA.
Veremos. Ou seja, ouvir. Resumindo, você entende.