Um novo dispositivo vestível desenvolvido por cientistas da Universidade de Cornell é capaz de capturar as expressões faciais de uma pessoa usando um sonar e reproduzi-las como um avatar digital. Evitar câmeras pode mitigar as preocupações com a privacidade.
EarIO, esse é o nome do aparelho, é hiper simples. É composto por um fone de ouvido com microfone e um alto-falante de cada lado, podendo ser conectado a qualquer fone de ouvido normal. Os alto-falantes reproduzem impulsos sonoros fora do alcance da audição humana, e seus ecos são captados por microfones, assim como um sonar funciona.
Os perfis de eco mudam de acordo com as expressões faciais: por isso, algoritmos adequadamente treinados reconhecem as variações recebidas pelo sonar e as traduzem em imagens.

EarlO, sonar que "vê" coisas a partir de sons
“Graças ao poder da inteligência artificial, nosso algoritmo constrói conexões intrincadas entre o movimento muscular e as expressões faciais que os humanos não conseguem perceber”, diz ele. Ke Li, um dos coautores do estudo. "Ele pode ser usado para extrair informações muito complexas: a de toda a frente do rosto." A pesquisa foi publicada na revista Anais da Association for Computing Machinery on Interactive, Mobile, Wearable and Ubiquitous Technologies. E eu te linko aqui.
A equipe testou o sonar EarIO em 16 participantes, executando o algoritmo em um smartphone comum. E o dispositivo foi capaz de reconstruir expressões faciais como uma câmera normal. Ruídos de fundo, como vento, conversas ou ruídos da rua, não interferiram minimamente em sua capacidade de gravar rostos.
Tecnologia de 007
Os pesquisadores apontam que o sonar tem várias vantagens sobre o uso de um câmera. Os dados acústicos consomem muito menos energia e capacidade de processamento, permitindo que você use dispositivos menores e mais leves. As câmeras também podem coletar muitas informações pessoais adicionais que os usuários podem não querer compartilhar, então o sonar pode ser mais seguro.
Claro que, voando com a imaginação, imagino tal tecnologia silenciosamente "deslizada" em um fone de ouvido normal, e acho que pode transmitir movimentos e expressões labiais à distância também para fins de vigilância. Desta vez, porém, vejo usos mais práticos.
Que? Em primeiro lugar, os do setor de videogames: uma maneira prática de replicar expressões faciais físicas em um avatar digital para jogos, realidade virtual ou metaverso. Agora a equipe está trabalhando para descartar outras interferências, como quando o usuário vira a cabeça, e simplificar o sistema de treinamento para o algoritmo de IA.
Veremos. Ou seja, ouvir. Resumindo, você entende.