Ainda não nos recuperamos do advento do DALL-E2, Midjourney e companheiros que Meta anunciou Faz um video, uma ferramenta que gera pequenos videoclipes a partir de descrições de texto. É o próximo passo para o mundo do conteúdo gerado por IA.
É a primeira vez que uma ferramenta de conversão de texto em vídeo chega tão perto do lançamento final. “A pesquisa em inteligência artificial está impulsionando a expressão criativa, fornecendo às pessoas ferramentas para criar novos conteúdos de forma rápida e fácil”, diz o documento. Comunicado de Imprensa apresentação.
Make-A-Video é capaz de dar vida à criatividade com poucas palavras ou linhas de texto e criar filmes distintos ricos em cores, personagens e cenários. O sistema também pode transformar fotografias ou vídeos existentes em novos filmes semelhantes.
Ótima jogada, Davi
“É muito mais difícil gerar vídeos do que fotos”, diz CEO da Meta Mark Zuckerberg num postar no Facebook. Mas vá, eu não pensei. “Além de gerar cada pixel corretamente, o sistema também deve prever como eles mudarão ao longo do tempo. Make-A-Video resolve esse problema adicionando uma camada de aprendizagem não supervisionada que permite ao sistema compreender o movimento no mundo físico e aplicá-lo à geração tradicional de texto para imagem.”
Il site da Make-A-Video apresenta alguns exemplos de vídeos feitos pela IA, como “um cachorro vestindo uma fantasia de super-herói com uma capa vermelha voando no céu” e “uma pintura de ursinho de pelúcia”. É mais uma demonstração do progresso incrivelmente rápido destes sistemas. Só dois? Três anos atrás? Essas coisas eram praticamente ficção científica.
Make-A-Video, maravilha (e, claro, perigos)
À medida que dependemos cada vez mais da IA para gerar arte, será cada vez mais importante que as empresas adotem políticas de transparência em torno destes algoritmos. Lendo o artigo de pesquisa por trás do Make-A-Video, fica claro que essa inteligência artificial foi “treinada” usando um subconjunto de um conjunto de dados chamado LAOIN, que também inclui imagens menos que limpas. Qual? Execuções do ISIS, nudez não consensual e assim por diante. Meta garante que examinou esses dados minuciosamente, descartando automaticamente imagens de nudez e outras imagens falsas.
Vai ser. Enquanto isso, a batalha pela ética continua.
A introdução do texto-para-vídeo como ferramenta para artistas e criadores também complica a (já espinhosa) questão da legitimidade da arte gerada pela IA. Em agosto, você sabe, um cara chamado Jason Allen ganhou um concurso de arte usando uma imagem criada por Midjourney, gerando um ninho de vespas de polêmica.
Mesmo empresas que coletam imagens para uso comercial (como Shutterstock ou Getty Images) fecharam as portas para esse conteúdo. Nenhuma questão ética, neste caso. Apenas legais. Quem é o dono das imagens usadas pelos algoritmos para treinar? Transformar essas imagens em coisas novas é uma violação dos direitos autorais ou não? As leis ainda não foram adaptadas.
Entretanto o tsunami continua: estas tecnologias estão literalmente a sobrecarregar o público, com a mesma rapidez com que demonstram aprender a aperfeiçoar-se. O anúncio de ontem no Make-A-Video segue por apenas um dia o lançamento público de DALLE-2 pela OpenAI. A empresa que desenvolveu o DALLE-2 retirou a lista de espera do sistema, permitindo que qualquer pessoa gere imagens a partir de linhas de texto.
Mas mesmo que o público tenha acesso a cada vez mais ferramentas de geração de arte através da IA, algumas das questões éticas fundamentais sobre a sua utilização permanecem em aberto: e exigem respostas.