A inteligência artificial está mudando a forma como interagimos com os computadores. Uma versão atualizada do Soneto de Cláudio 3.5, o principal modelo de IA de Antrópico, é um exemplo claro desta evolução: se a versão anterior se limitava ao diálogo em texto, esta nova atualização acabado de anunciar é capaz de interpretar interfaces gráficas e interagir com aplicações de forma autônoma.
Uma abordagem que abre novas possibilidades para a automatização de atividades digitais, “movendo-se” tal como uma pessoa faria num PC. Vamos ver juntos como funciona essa tecnologia e quais são suas reais aplicações.
Como funciona a interação com o PC
Claude 3.5 Sonnet usa um sistema chamado “Computer Use API” para interagir com o desktop. Na prática, a IA observa a tela por meio de capturas de tela e analisa o que vê, assim como faria um usuário humano. Quando precisa interagir com um aplicativo, calcula a distância em pixels para chegar ao ponto desejado e simula as ações necessárias: cliques do mouse, digitação no teclado, movimentos do cursor.
Treinamos Claude para ver o que acontece na tela e depois utilizar as ferramentas de software disponíveis para realizar as tarefas.
Antrópico
A principal inovação desta versão? Uma habilidade há muito esperada: a capacidade de usar qualquer aplicativo de desktop. Não se trata mais apenas de responder perguntas ou gerar texto, mas para interagir ativamente com o software.
O novo Soneto 3.5, aplicações práticas
As possibilidades de uso são inúmeras. Por exemplo, Replicar, uma plataforma de desenvolvimento de software, já está usando o Claude 3.5 Sonnet para criar um “verificador autônomo” que avalia aplicativos durante seu desenvolvimento. Canva , a plataforma de edição gráfica online, está explorando maneiras de integrar IA ao processo de design e edição.
Está tudo tão “uau” quanto parece? Não. Ele roubará nossos empregos? Nenhum. É importante ser realista quanto às capacidades atuais do sistema. Em um teste de reserva de voo, Claude 3.5 Sonnet conseguiu completar com sucesso menos da metade das tarefas atribuídas. Mesmo tarefas aparentemente simples, como rolagem e zoom, ainda podem ser problemáticas.
Por outro lado, ela mesma admite Antrópico:
O uso do computador por Claude continua lento e frequentemente sujeito a erros. Incentivamos os desenvolvedores a começarem com tarefas de baixo risco.
Quanto tempo levará até que o Soneto 3.5 seja perfeito? Levará anos, meses ou semanas? Se você pensar bem, você já sabe a resposta, ou algo muito próximo disso.
Algumas notas sobre segurança
A questão da segurança é fundamental. Antrópico, que se passa por ser o “bom menino” das empresas de IA, implementou diversas medidas preventivas:
- A IA não é treinada em capturas de tela do usuário;
- Ele não tem acesso à web durante o treinamento;
- Classificadores foram desenvolvidos para evitar ações de alto risco;
- As capturas de tela são retidas apenas por 30 dias, como medida de segurança.
Perspectivas futuras
Paralelamente ao desenvolvimento da nova versão do Claude 3.5 Sonnet, Antrópico também anunciou a chegada de uma versão atualizada do Haiku, modelo mais barato e eficiente da série Claude. Um pequeno passo no campo da IA acessível em diferentes níveis de utilização. Claro, isso ainda consome muito, muito em termos de energia e recursos.
De qualquer forma, parece-me particularmente interessante como esta tecnologia está a mudar a nossa relação com os computadores. Não estamos mais falando de simples scripts de automação, mas de sistemas que entendem e interagem com interfaces gráficas de forma quase humana.
Claude Sonnet 3.5: passos equilibrados, mas numa direção surpreendente
Como acontece frequentemente no domínio da IA, o verdadeiro valor desta inovação será medido não tanto nas suas capacidades técnicas, mas na forma como podemos integrá-la de forma útil nos nossos fluxos de trabalho diários. O desafio do futuro será encontrar o equilíbrio certo entre a automação e o controlo humano, aproveitando ao máximo o potencial desta tecnologia sem perder de vista os seus limites e responsabilidades éticas.
As capacidades do Claude 3.5 Sonnet, não impressionantes por si mesmas, são, no entanto, impressionantes pela direção que mostram. Ainda estamos no início desta jornada tecnológica: o que acontecerá em breve?