Pesquisadores da Universidade da Califórnia em San Diego construíram recentemente um sistema de aprendizado de máquina que prevê quais pássaros estão prestes a cantar.
Se você não encontrar grandes possibilidades práticas, começarei dizendo que a síntese de fala preditiva em tempo real para próteses de voz já seria uma coisa excelente. Mas as implicações de compreender o canto dos pássaros podem ir muito mais longe.
Canção dos pássaros, um mundo extremamente articulado
O canto de pássaros é uma forma complexa de comunicação que envolve ritmo, tom e, o mais importante, comportamentos aprendidos.
Segundo os pesquisadores, ensinar uma inteligência artificial a compreender (e ser capaz de construir o suficiente para antecipar) o canto dos pássaros é um passo valioso no caminho para substituir as vocalizações humanas biológicas.
As próteses motoras usavam primatas como modelo animal. Não existe modelo semelhante para próteses vocais. Talvez seja por isso que estes são mais limitados em termos de tecnologia de interface neural, cobertura cerebral e desenho de estudo comportamental.
Não é fácil “pensar” o canto dos pássaros, mas é um passo importante
Os pássaros canoros são um modelo interessante de comportamento vocal aprendido complexo. O canto dos pássaros compartilha uma série de semelhanças únicas com a fala humana. Estudá-lo já proporcionou excelentes informações gerais sobre os mecanismos e circuitos subjacentes à aprendizagem, execução e manutenção da habilidade motora vocal.
Mas traduzir vocalizações em tempo real não é um desafio fácil. Os sistemas atuais ainda são lentos em comparação com nossos padrões naturais de pensamento-fala.
Pense nisso, porque é lindo: os sistemas de processamento de linguagem natural de ponta ainda lutam para acompanhar o pensamento humano.
Ainda somos muito rápidos para um carro
Quando interagimos com nosso Google Assistant ou Alexa, muitas vezes há uma pausa mais longa do que esperaríamos ao conversar com uma pessoa real. Isso porque a IA está processando nossa fala, determinando o significado de cada palavra em relação às suas capacidades, e então descobrindo quais reações ou programas acessar para responder.
Claro, já é surpreendente que esses sistemas baseados em nuvem funcionem nessa velocidade. Mas eles ainda não são bons o suficiente para criar uma interface em tempo real que permita aos que não têm voz falar na velocidade do pensamento.
Pesquisa sobre o canto dos pássaros
Primeiro, a equipe implantou eletrodos em uma dúzia de cérebros de pássaros (tentilhões-zebra) e depois começou a registrar a atividade cerebral durante o canto dos pássaros.
Mas não basta treinar uma IA para reconhecer a atividade neural dos pássaros durante o seu canto: mesmo o cérebro de um pássaro é demasiado complexo para mapear completamente como funcionam as comunicações entre os seus neurónios.
Assim, os pesquisadores treinaram outro sistema para reduzir as músicas em tempo real em padrões reconhecíveis com os quais a IA possa trabalhar.
É muito interessante, porque fornece uma solução para um problema pendente.
O processamento do canto dos pássaros em tempo real é impressionante e replicar esses resultados com a linguagem humana seria histórico.
Mas esse primeiro trabalho ainda não está pronto. E ainda não é adaptável a outros sistemas de fala. Pode não funcionar além do canto dos pássaros.
Mas se assim fosse, seria um dos primeiros saltos tecnológicos gigantescos para interfaces cérebro-computador desde o ressurgimento do aprendizado profundo em 2014.