Desde a estreia do ChatGPT em diante, vários desafiantes (ou aspirantes) levantaram suas vozes para roubar parte da atenção dedicada ao modelo OpenAI. E hoje existe um nome que está fazendo muito barulho: Claude 2.0. Sim, você leu certo, há outro xerife na cidade e ele promete fazer cumprir sua lei. Vamos dar uma olhada no que torna o Claude 2.0 tão especial.
A “revolta” dos exilados
Versão 2.0 de Claude (você pode encontrar aqui) não é simplesmente uma atualização. Este modelo de IA nascido de Antrópico, uma startup fundada por dois ex-colaboradores da OpenAI, é um salto quântico em comparação com sua versão anterior, 1.3.
Os dados falam por si. no teste Codex HumanEval, projetado para avaliar a proficiência em programação Python, o Claude 2.0 obteve impressionantes 71,2%, uma melhora marcante em relação aos anteriores 56,0%.
Isso não é tudo: ele também demonstrou habilidades matemáticas superiores, com uma pontuação em 88,0% no GSM8k, um conjunto de problemas de matemática para o nível da série. Claude é a IA que todos gostariam de ter ao seu lado durante uma prova.
Claude 2.0, o “bom” gigante
Entre as suas características distintivas, Claude 2.0 inclui certamente um design mais “educado”, que dá especial ênfase à redução de danos, tentando evitar conteúdos ofensivos ou perigosos. Comparado com a versão anterior, Claude 1.3, o novo modelo é duas vezes mais eficaz na geração de respostas confiantes. Isso o torna a escolha ideal para empresas que buscam resultados seguros e ecologicamente corretos.
No entanto, a definição de “gigante” é obtida a nível quantitativo: Claude 2.0 pode processar uma enorme quantidade de dados de uma só vez. Estou falando de 100.000 mil tokens, ou cerca de 75.000 mil palavras. É como ler um romance em segundos!
Claude é mais forte que ChatGPT?
A pergunta do milhão de euros. Como está o Claude 2.0 com o ChatGPT? Você vai me desculpar se Eu não acho que Bard esteja à altura ainda. Eu consideraria 3 fatores e algumas "miudezas".
Limites de contexto:
Cláudio 2.0: como mencionado, ele tem um limite de 100.000 tokens, o que permite processar prompts de texto mais longos e ter um contexto e uma janela de memória maiores.
Bate-papoGPT: Tem várias limitações dependendo da versão: Bate-papoGPT-3 tem um limite de 4096 tokens, GPT4 (8K) tem um limite de 8000 tokens e GPT4 (32K) Tem um limite de 32000 tokens. Isso significa que a “memória” de conversas do ChatGPT não remonta até Claude 2.0.
Tempo de processamento:
Cláudio 2.0: Projetado para um desempenho mais rápido, com um tempo médio de resposta de aproximadamente 5 segundos.
Bate-papoGPT: Geralmente leva de alguns segundos até 30 segundos para gerar uma resposta. A velocidade pode diminuir durante os períodos de pico de demanda.
Pontuações dos testes - USMLE, BAR e GRE:
Cláudio 2.0: Teve pontuação melhor do que ChatGPT na seção de redação do GRE e no exame da Ordem.
Bate-papoGPT: Ele obteve pontuação melhor do que Claude nas seções verbais e quantitativas do GRE e no exame USMLE.
USMLE: Significa “Exame de Licenciamento Médico dos Estados Unidos”. É um exame para médicos que desejam obter licença para exercer a medicina nos Estados Unidos. O exame avalia a capacidade do médico de aplicar conhecimentos, conceitos e princípios e demonstrar habilidades essenciais para a prática segura e eficaz da medicina. BARRA: Refere-se ao exame da ordem, que é um exame no qual um indivíduo deve ser aprovado para ser admitido para exercer a advocacia em uma determinada jurisdição. Os exames da Ordem variam de estado para estado nos Estados Unidos, mas geralmente consistem em uma série de testes escritos sobre vários tópicos jurídicos. GRE: Significa “Exame de Registro de Graduação”. É um exame padronizado usado para admissão em programas de mestrado e doutorado em muitas universidades, principalmente nos Estados Unidos. Avalie as habilidades de redação verbal, quantitativa e analítica do candidato.
Outras coisas a considerar
Nas notas laterais: o ChatGPT é mais popular, enquanto o Claude está disponível apenas nos EUA e no Reino Unido (mas você pode experimentá-lo mesmo se não estiver nesses dois países, usando uma VPN). Novamente: no momento o Claude é gratuito, enquanto o ChatGPT tem duas versões: gratuita e paga. Outro? Oh sim. ChatGPT tem plugins, Claude 2.0. Mas o Claude 2.0 foi atualizado para 2023 e o ChatGPT para 2021. Mas o ChatGPT pode se conectar online e o Claude 2.0 não.
Em suma, eles se dão um bom motivo. Ainda acho o ChatGPT pela frente, mas devo dizer que Claude 2.0 é um excelente desafiante e poderá em breve tentar a ultrapassagem. Por nariz, o que você escolheria? Ou melhor: você já está usando os dois? Qual você prefere? Estamos aqui para te ler, diga-nos a sua opinião nas redes sociais da Futuro Prossimo!