Lembra-se de qual foi o primeiro navegador da Web que utilizou? Seja qual for a sua resposta, a verdade é que, na essência, a forma de utilizá-los não mudou muito desde o Netscape Navigator.
Sim, ao longo dos anos, os navegadores passaram por mudanças profundas. No início, eles suportavam páginas planas, quase como um jornal digital, e hoje carregam sites cheios de fotos e vídeos. Foram eles que nos trouxeram as abas, que mudaram para sempre a forma de organizar as páginas abertas.
A segurança também foi reforçada com o cadeado HTTPS, o design adaptável, que permitiu transferir a web para o telemóvel sem perder a facilidade de utilização, e muito mais. Tudo isso foram etapas importantes, mas a verdade é que, na essência, nunca deixámos de aceder, escrever, clicar e processar as páginas nós mesmos.
Houve muitas conquistas, mas a interação permaneceu a mesma
No entanto, essa dinâmica pode mudar em breve. E há boas razões para acreditar que isso vai acontecer. A indústria tecnológica concentrou a sua atenção na automação, num contexto em que os agentes de IA assumem a maior parte do trabalho pesado.
Esses sistemas devem ser capazes de:
- Planear e dividir tarefas complexas em etapas lógicas.
- Escolher as melhores ferramentas para realizar as tarefas definidas.
- Ter memória e contexto para conhecer o utilizador e oferecer-lhe as soluções mais adequadas.
Imagine agentes capazes de gerir tarefas do início ao fim. Desde organizar uma viagem com reservas de hotéis e passagens aéreas ao melhor preço até cuidar das compras semanais, criar tabelas ou trabalhar com software especializado. Bastaria dar-lhes instruções (e as autorizações necessárias) para que agissem em nosso nome e nos consultassem apenas quando necessário: para confirmar uma compra, escolher uma opção ou resolver um problema durante o processo.
A interação com eles seria direta: texto numa janela de chat ou, melhor ainda, voz. Não haveria mais problemas com menus, formulários ou interfaces tradicionais de páginas web e programas.
A verdade é que já vemos passos nessa direção. A Perplexity tem o Comet, um navegador com inteligência artificial que executa tarefas em nome do utilizador. A OpenAI apresentou o Operator, que posteriormente foi integrado ao modo de agente ChatGPT com seu próprio navegador.
A Anthropic, por sua vez, entrou nor Chrome, e o Google está a desenvolver o Project Astra, um sistema de agente que vai além do navegador e pode funcionar diretamente em dispositivos Android.
No momento, a maioria dessas propostas está em fase experimental e tem aplicação limitada. Mas não seria estranho se, dada a velocidade de desenvolvimento do setor, elas logo se tornassem uma nova forma de interagir com a Internet.
Comet, o agente-navegador da Perplexity Basta lembrar como trabalhávamos antes de 30 de novembro de 2022, quando o ChatGPT ainda não existia. Em apenas dois anos e oito meses, a tecnologia mudou radicalmente a situação. No entanto, nem tudo é tão otimista. Um dos maiores problemas dos agentes de navegador é a segurança. E há muitos problemas aqui.
Ninguém quer que um agente, interpretando mal as instruções, reserve o voo errado ou compre algo desnecessário. Também não queremos que eles se tornem vítimas de cibercriminosos, que já estão a estudar maneiras de manipulá-los, como já tentaram fazer
Instruções maliciosas são um exemplo claro: se é possível enganar uma pessoa, também é possível tentar forçar um agente a realizar ações contra nós, como revelar senhas ou extrair informações confidenciais.
A questão é inevitável: estamos entrando na era dos agentes de inteligência artificial no navegador? Você os usaria?