Com transmissão ao vivo no YouTube às 21h, horário italiano, a OpenAI apresentou sua nova joia, GPT-4, que está decididamente em um nível superior à versão anterior, lançada há apenas alguns meses. Agora o “especialista em conversação” ChatGPT não é apenas mais poderoso, mas também pode “ver”. E este factor pode dar origem a uma aceleração sem precedentes no desenvolvimento da inteligência artificial.
De GPT-3 a GPT-4 um mar passa
ChatGPT, o “pequeno gênio eletrônico” da OpenAI que responde mensagens com texto e código, rapidamente se tornou o aplicativo de crescimento mais rápido da história, com mais de 100 milhões de usuários por mês.
Paralelamente ao seu desenvolvimento, nasceram comunidades de usuários e guias de usuários (também publiquei um: se você estiver interessado você pode encontrar na amazon) e até uma “proproprofissão”, a de engenheiro de alerta.
No entanto, apesar de seu sucesso, o ChatGPT teve alguns problemas para resolver. Ele tendia a “alucinar”, gerando textos que pareciam plausíveis, mas não eram. Refletiu preconceitos, por vezes “furou” os filtros de frases ilícitas previstos pelos seus criadores.
A nova versão baseada em GPT-4 resolve a maioria desses problemas e melhora (muito) o desempenho.
Olhos abertos para o mundo
A grande novidade deste modelo é a sua capacidade de responder a solicitações textuais e visuais. Pense nas possibilidades: identificar o autor de uma pintura, explicar o significado de um meme, criar legendas para fotografias... A verdade é que o campo de possíveis aplicações se expande tanto que uma lista de possíveis se torna gigantesca.
Mas o GPT-4 não para por aí: também é significativamente mais “inteligente” que seu antecessor, superando seus resultados em diversos testes, como os das profissões jurídicas. (LSAT), aqueles usados para admissão em faculdades americanas (Sábado), e muitos outros. OpenAI afirma que GPT-4 é 40% mais preciso na geração de conteúdo verdadeiro e 82% menos inclinado para responder a solicitações ilícitas (adeus versões “malignas” do chatbot).
Todo o resto é história
Iremos nos perguntar muito sobre as incríveis características que as inteligências artificiais generativas irão adquirir cada vez mais (e cada vez mais rapidamente). Graças à sua capacidade de “ver”, o GPT-4 alimentará muitos aplicativos que usamos todos os dias.
Em primeiro lugar, como mencionado, o novo ChatGPT (em sua versão paga), agora capaz de processar textos de até 25.000 palavras: pode resumir, escrever e reescrever, gerenciar livros inteiros. GPT-4 também faz parte do mecanismo de pesquisa Bing. o Khan Academy está usando para criar um tutor virtual para os alunos, enquanto Seja meus olhos desenvolveu um assistente de IA que pode analisar e descrever fotografias para pessoas com deficiência visual.
Acompanhar suas evoluções será cada vez mais complicado.
GPT-4, perspectivas futuras
Obviamente o sistema ainda pode ser melhorado, ainda apresenta imperfeições, mas o progresso é notável e muito rápido. A empresa já está explorando como integrar também áudio, vídeo e outras entradas em versões futuras do modelo. Seu objetivo é que o GPT-4 se torne uma ferramenta valiosa para melhorar a vida das pessoas, potencializando inúmeras aplicações.
Em breve este aparelho também nos dirá o que pensa das nossas roupas, ou recomendará o corte de cabelo mais adequado. Irá alimentar sistemas de vigilância aos quais apresentamos os nossos amigos e familiares, para que imediatamente abram apenas para eles. Fará dos nossos carros “supercarros” que interagem de forma pessoal com o condutor. Será a “voz narrativa” de muitas pessoas cegas e irá ajudá-las a sentirem-se mais integradas. E quem sabe o que mais.
Como mencionei, não posso mostrar todos os pontos de chegada: no máximo, mando você de volta ao ponto de partida com o anúncio oficial no blog OpenAIou com o vídeo da apresentação de ontem, para que você possa ter uma ideia por si mesmo.
Por enquanto, porém, digamos “bem-vindos” a este extraordinário polivalente que, para quem ainda não o compreendeu, já mudou as nossas vidas.