Um instituto futurista visa preservar (e recriar) as vozes das pessoas usando inteligência artificial.
Pesquisadores envolvidos na iniciativa "banco de voz" esperam poder mudar a vida de todas as pessoas que perdem a voz como resultado de doenças ou acidentes. Perder a voz não é realmente como ter uma diminuição momentânea do som ou uma rouquidão. A perda da voz é em parte a perda da identidade.
Tudo começou com uma colaboração entre a Northeastern University of Boston e o Vogais D.. É importante fornecer àqueles que perdem o uso da fala uma maneira de manter um senso de identidade após o câncer de garganta ou doença degenerativa. Este projeto permitirá que eles "falem" usando uma forma sintética muito semelhante à sua própria voz.
É o primeiro centro desse tipo e será liderado pelo prof. Rupal Patel, fundador e CEO da VocaliD.
A empresa já oferece esse serviço para indivíduos, diz Patel, mas muitas pessoas não têm equipamentos de qualidade suficiente para amostrar adequadamente os vocais. Construir um "banco de voz" permite que futuros pacientes mantenham sua voz quando ainda tiverem a chance.
"Os pacientes muitas vezes vêm até nós no último momento", diz “Eles não têm tempo suficiente para manter a voz porque estão à mercê de doenças, operações e muito mais. E é muito frustrante."
O banco de voz
O resultado foi a colaboração com a Northeastern para difundir a tecnologia ao público. O coração do projeto é a Clínica de Preservação por Voz, um centro onde os pacientes em risco de perder a voz podem registrá-lo para protegê-lo.
A abordagem é muito mais complicada do que aquelas baseadas em sínteses de fala tradicionais: um algoritmo de aprendizado de máquina reconstrói ligaduras, fonemas e até ritmo em relação à respiração. Em um estande especial, são registradas pequenas histórias, poemas ou conversas sobre diferentes temas. Alguém até brincou sobre perder a voz, uma maneira auto-depreciativa de lidar com grande medo.
“O que é preciso é cerca de duas ou três horas de fala. A partir dessas gravações nossa inteligência artificial é capaz de gerar um motor de voz que tenha o mesmo som. É como devolver a voz a quem a perdeu”.
A voz regenerada pode ser usada como síntese de fala para a conversão de textos escritos e pode ser integrada amanhã com software que gera palavras, imagens ou ações a partir de caminhos mentais.
Uma melhoria muito rápida
A tecnologia, diz Patel, está melhorando rapidamente e em breve será capaz de reproduzir uma fala indistinguível da fala humana.
A equipe também poderá "envelhecer" a voz para adaptá-la à idade da pessoa, enquanto ainda não é possível "crescer" a voz de um menino transformando-a em adulta.