Com uma transmissão ao vivo no YouTube às 21h, horário italiano, OpenAI apresentou sua nova joia, GPT-4, que está em um nível decididamente superior à versão anterior, lançada há apenas alguns meses. Agora, o ChatGPT "especialista em conversação" não é apenas mais poderoso, mas também capaz de "ver". E esse fator pode dar lugar a uma aceleração sem precedentes no desenvolvimento da inteligência artificial.
De GPT-3 a GPT-4 um mar passa
O ChatGPT, o "pequeno gênio eletrônico" da OpenAI que responde a mensagens com texto e código, tornou-se rapidamente o aplicativo de crescimento mais rápido da história, com mais de 100 milhões de usuários por mês.
Paralelamente ao seu desenvolvimento, nasceram comunidades de usuários e guias de usuário (também publiquei um: se você estiver interessado você pode encontrar na amazon) e até uma "protoprofissão", a de engenheiro de alerta.
No entanto, apesar de seu sucesso, o ChatGPT teve alguns problemas para resolver. Ele tendia a "alucinar", gerando letras que soavam plausíveis, mas não eram. Refletia preconceitos, às vezes "perfurava" os filtros de frases ilegais fornecidos por seus criadores.
A nova versão baseada em GPT-4 resolve a maioria desses problemas e melhora (muito) o desempenho.

Olhos abertos para o mundo
A grande novidade sobre esse modelo é sua capacidade de responder a solicitações textuais e visuais. Pense nas possibilidades: identificar o autor de uma pintura, explicar o significado de um meme, criar legendas para fotografias... A verdade é que o campo de aplicações possíveis se alarga tanto que uma lista de possíveis torna-se gigantesca.
Mas o GPT-4 não para por aí: também é muito mais "inteligente" que seu antecessor, superando seus resultados em diversos testes, como os das profissões jurídicas (LSAT), aqueles usados para admissão em faculdades americanas (SAT), e muitos outros. OpenAI afirma que GPT-4 é 40% mais preciso na geração de conteúdo verdadeiro e 82% menos inclinado para responder a solicitações ilícitas (adeus versões "más" do chatbot).

Todo o resto é história
Nos perguntaremos muito sobre as incríveis características que as inteligências artificiais generativas irão adquirir cada vez mais (e cada vez mais rápido). Graças à sua capacidade de "ver", o GPT-4 alimentará muitos aplicativos que usamos diariamente.
Em primeiro lugar, como mencionado, o novo Bate-papo GPT (em sua versão paga), agora capaz de processar textos de até 25.000 palavras: pode resumir, escrever e reescrever, gerenciar livros inteiros. GPT-4 também faz parte do mecanismo de pesquisa Bing. o Khan Academy está usando para criar um tutor virtual para os alunos, enquanto Seja meus olhos desenvolveu um assistente de IA que pode analisar e descrever fotografias para pessoas com deficiência visual.
Acompanhar suas evoluções será cada vez mais complicado.

GPT-4, perspectivas futuras
Obviamente o sistema ainda pode ser melhorado, ainda tem algumas imperfeições, mas o progresso é notável e muito rápido. A empresa já está explorando como integrar áudio, vídeo e outras entradas em versões futuras do modelo também. Seu objetivo é que o GPT-4 se torne uma ferramenta inestimável para melhorar a vida das pessoas, alimentando vários aplicativos.

Daqui a pouco, esse gadget também nos dirá o que pensa de nossas roupas ou recomendará o corte de cabelo mais adequado. Ele alimentará os sistemas de vigilância que apresentamos aos nossos amigos e parentes, para abrir imediatamente apenas para eles. Ele transformará nossos carros em "supercarros" que interagem pessoalmente com o motorista. Será a "voz narrativa" de muitos cegos e os ajudará a se sentirem mais integrados. E quem sabe o que mais.
Conforme mencionado, não posso indicar todos os pontos de chegada: no máximo, posso enviar você de volta ao ponto de partida com o anúncio oficial no blog OpenAIou com o vídeo da apresentação de ontem, então você mesmo tem a ideia.
Por agora, porém, digamos "bem-vindo" a este extraordinário faz-tudo que, para quem ainda não percebeu, já mudou as nossas vidas.