Pela primeira vez, uma equipe internacional de engenheiros e cientistas da computação desenvolveu uma tecnologia que combina detecção de radiofrequência com inteligência artificial para ler os lábios e identificar seus movimentos.
Os aparelhos auditivos atuais ajudam as pessoas com perda auditiva, amplificando todos os sons do ambiente circundante, o que é útil em diversas aplicações. Em ambientes ruidosos, entretanto, o amplo espectro de amplificação desses dispositivos pode dificultar a concentração dos usuários em sons específicos. Por exemplo, uma conversa com uma determinada pessoa.
Uma possível solução para este problema, conhecido como “efeito coquetel”, é criar aparelhos auditivos “inteligentes”. Novos dispositivos que combinam amplificação de áudio convencional com um segundo dispositivo que coleta dados adicionais para melhor desempenho.
Edição de singularidade de leitura labial
Em novo artigo publicado hoje na revista Natureza das Comunicações (eu linko aqui), equipe liderada pela Universidade de Glasgow mostra o uso de tecnologia de detecção de ponta para leitura labial. O seu sistema preserva a privacidade ao recolher apenas dados de radiofrequência, sem explorar imagens (e, portanto, sem problemas de privacidade, pelo menos nas imagens).
Para desenvolver o sistema, os pesquisadores pediram a voluntários do sexo masculino e feminino que repetissem as cinco vogais (A, E, I, O e U) primeiro sem máscara e depois usando máscara cirúrgica. Seus rostos foram escaneados tanto com a boca fechada quanto durante a pronúncia, usando sinais de radiofrequência de um sensor de radar dedicado e um transmissor wifi.
As 3.600 amostras de dados coletadas com as varreduras foram usadas para “treinar” algoritmos de aprendizado de máquina e aprendizado profundo para reconhecer movimentos característicos da boca e ler lábios, associando cada movimento a um som.
Resultado?
O sistema apresentou uma taxa de precisão 95% para lábios desmascarados e 83% para lábios mascarados. Impressionante.
O médico Qammer Abbasi da Universidade de Glasgow, autor principal do artigo, explica o trabalho realizado. “Cerca de 5% da população mundial, 430 milhões de pessoas, têm alguma forma de deficiência auditiva. Os aparelhos auditivos fizeram a diferença para muitos deles. Novas tecnologias que coletam dados para melhorar a amplificação sonora poderiam dar um passo decisivo”.
Em resumo: esta pesquisa mostra que os sinais de radiofrequência, e até mesmo os sinais de Wi-Fi, podem permitir a leitura dos lábios mesmo quando eles estão cobertos por uma máscara. Deixo a reflexão sobre os usos “negativos” desta tecnologia à imaginação de todos, e foco apenas nos aspectos positivos.
Os futuros aparelhos auditivos multimodais eliminarão quaisquer diferenças entre as pessoas, colocando os 5% da população mundial com problemas auditivos no mesmo “comprimento de onda” (é preciso dizer) que todos os outros.