Eu sei, estávamos todos distraídos por outra coisa: em janeiro de 2021 OpenAI, empresa fundada por Elon Musk e apoiada pela Microsoft, lançou seu projeto mais ambicioso até hoje: um sistema de aprendizado de máquina chamado DÊ A ELA.
O que essa inteligência artificial faz? Rapidamente dito: produz imagens a partir de uma simples descrição de texto. Um exemplo? Escreva "Um camelo com um livro como chapéu", ou "Uma gravata feita de garfos" e ele desenha, cria, enfim: ele tira uma imagem.
Agora, o Open AI revelou a segunda versão do DALL-E, e as coisas ficaram muito sérias: a resolução ficou muito melhor e o tempo de produção muito menor. Uma típica dinâmica exponencial à qual as inteligências artificiais nos acostumaram e, sobretudo, nos acostumarão. Também porque, se você se lembra, o chefe da Open AI acabou de dizer que essas máquinas talvez (talvez) eles estão se tornando conscientes.

Um pouco de Wall-E, um pouco de Dali
A versão XNUMX do DALL-E (uma junção de "Dali", como o artista, e "WALL-E", como o personagem animado da Disney) foi capaz de gerar imagens e juntar várias fotos em uma colagem, oferecendo perspectivas. e dedução de elementos de uma imagem por conta própria, por exemplo, efeitos de sombreamento.
Um designer super bom, com todas as imagens do mundo à sua disposição, que interpreta pedidos e desenha instantaneamente.
"Ao contrário de um mecanismo de renderização 3D, que requer entradas precisas, o DALL-E geralmente é capaz de 'preencher os espaços em branco' quando a legenda implica que a imagem deve incluir um determinado elemento não indicado especificamente", escreveu a equipe no ano passado. no blog Open AI.

Como funciona o desenho sob demanda da IA?
O DALL-E não foi feito para ser um produto comercial, e a equipe da OpenAI decidiu que seria o melhor. Os pesquisadores "impediram" que ele criasse imagens sexuais ou políticas, por exemplo, para evitar que o sistema fosse usado para gerar desinformação. Mesma coisa para nomes específicos: impossível pedir a ele, dizer, "desenhe Frank Sinatra jogando tênis com um urso polar".
DALL-E 1, em essência, aproveita o incrível interpretador de linguagem GPT-3 (aqui eu falo sobre isso mais a fundo, se você estiver interessado) e desenha o que entende mais do que o que "sente".

Ao contrário da primeira versão, que estava disponível para todos no site da OpenAI, esta só está disponível para teste por um número limitado de parceiros: aguardo alguns dias por uma resposta da Open AI para entrar no grupo.