Você consegue imaginar um gato cinza? Bem. Agora imagine ele com pelo branco. Agora imagine-o caminhando na Grande Muralha da China. Feito? Aqui, nestes momentos, uma rápida série de ativações neuronais em seu cérebro produziu variações na imagem apresentada, com base no seu conhecimento prévio do mundo.
Fácil de imaginar, para nós, seres humanos. Para uma inteligência artificial, porém, a história é completamente diferente. Apesar dos avanços nas redes neurais que igualam ou excedem o desempenho humano em determinadas tarefas, os computadores ainda estão longe da capacidade humana de imaginar coisas.
Imagine? Impossível para uma IA. Pelo menos até ontem.
Agora, uma equipe de pesquisa da USC desenvolveu inteligência artificial que usa habilidades humanas para imaginar um objeto nunca antes visto com atributos diferentes. O artigo, intitulado “Síntese Zero-Shot com Aprendizagem Supervisionada em Grupo”, foi lançado em maio, e a pesquisa colateral floresceu desde então.
“Fomos inspirados pelas capacidades humanas de generalização visual para tentar simular a imaginação humana em máquinas”, diz o autor principal do estudo Yunhao Ge. “Os humanos podem separar o conhecimento aprendido por atributos, por exemplo forma, pose, posição, cor, e depois recombiná-los para imaginar um novo objeto. Nosso artigo tenta simular esse processo usando redes neurais.”
O problema de generalização da inteligência artificial
Suponha que queiramos criar um sistema de inteligência artificial que gere imagens de carros. No início fornecemos ao algoritmo algumas imagens de um carro. A tarefa seria gerar vários tipos de carros, em qualquer cor, de vários ângulos. Este é um sério desafio: criar redes neurais capazes de extrair as regras subjacentes e aplicá-las a uma ampla gama de novos exemplos nunca vistos antes. Mas as redes hoje são treinadas nas características da amostra, sem levar em conta os atributos de um objeto.
Nesse novo estudo, os pesquisadores tentaram superar essa limitação.
O segredo? É chamado de desembaraçar
O trabalho da equipe de pesquisa baseou-se na aplicação de um método denominado desemaranhamento. O desembaraço pode ser usado para gerar deepfake, por exemplo, sintetizando novas imagens e vídeos que substituem a identidade de uma pessoa pela de outra, mas mantendo o movimento original.
A nova abordagem utiliza um grupo de imagens de amostra, e não uma amostra de cada vez, como os algoritmos tradicionais. Dd extrai a semelhança entre eles para alcançar algo chamado “aprendizado de representação desemaranhada controlável”.
Em seguida, recombina esse conhecimento para obter uma “nova síntese de imagens controlável”. Poderíamos usar o verbo “imaginar”.
É um processo muito semelhante a como nós, humanos, extrapolamos: quando um humano vê a cor de um objeto, podemos aplicá-la facilmente a qualquer outro objeto, substituindo a cor original pela nova. Usando a técnica de desembaraçar, a equipe gerou um novo conjunto de dados contendo 1,56 milhão de imagens que podem auxiliar pesquisas futuras na área.
Imaginar ajuda a entender o mundo
Embora o desemaranhamento não seja uma ideia nova, os investigadores dizem que a sua estrutura pode ser compatível com quase qualquer tipo de dados ou conhecimento. Isso amplia as oportunidades de aplicações.
No campo da medicina, por exemplo, o desemaranhamento poderia ajudar médicos e biólogos a descobrir medicamentos mais úteis, separando a função médica de outras propriedades e depois recombinando-as para sintetizar novos medicamentos. Fazer com que as máquinas “imaginem” também poderia ajudar a criar uma inteligência artificial mais segura. Por exemplo, permitir que veículos autónomos imaginem e evitem cenários perigosos nunca antes vistos durante o treino.
“O aprendizado profundo já demonstrou desempenho e promessa insuperáveis em muitos campos. Muitas vezes, porém, isso aconteceu através de mimetismo superficial e sem uma compreensão mais profunda dos atributos separados que tornam cada objeto único”, disse Laurent Itti, professor de ciência da computação. “Esta nova abordagem de desemaranhamento, pela primeira vez, liberta verdadeiramente um novo sentido de imaginação nos sistemas de IA, aproximando-os da compreensão humana do mundo.”