OpenClaw, PRIP e o futuro dos agentes pessoais
O que eu aprendi construindo o meu próprio agente, e para onde, na prática, a nova geração de IAs está caminhando.
Há pouco mais de um mês, resolvi finalmente fazer o setup de um agente próprio baseado no OpenClaw. Batizei de PRIP.
O projeto foi desafiador e fascinante na mesma medida. Quase como efeito colateral, me trouxe muitas reflexões. Tanto na hora de configurar o agente quanto, principalmente, ao usá-lo de verdade no dia a dia.
O que vem a seguir é um pouco do que aprendi nesse primeiro mês.
00OpenClaw versus os modelos mais tradicionais
Hoje já seria impreciso colocar OpenClaw de um lado e todos os outros sistemas do outro, como se o restante do mercado continuasse parado na era do prompt e resposta. Isso não é verdade. O mercado inteiro já está andando na direção dos agentes.
O ChatGPT agent, por exemplo, combina navegador, terminal, análise de arquivos e conectores para executar tarefas mais longas, com etapas de supervisão e controle do usuário. A OpenAI o posiciona claramente como uma ponte entre pesquisa, raciocínio e ação.
Do lado da Anthropic, o Claude Cowork também já é um passo importante nessa direção. Mais recentemente, a empresa expandiu o produto para permitir que Claude opere o computador do usuário, abra aplicativos, navegue no browser e use ferramentas locais. Além disso, o Dispatch passou a permitir que tarefas sejam acionadas e acompanhadas pelo celular, enquanto o Claude continua rodando a partir da máquina do usuário. Isso é altamente significativo, porque começa a criar uma ponte contínua entre desktop, mobile e execução persistente.
Ou seja, a comparação correta não é entre OpenClaw e um mundo antigo, estático e puramente conversacional. A comparação correta é entre um framework já nascido para ser agente, como o OpenClaw, e produtos dos grandes laboratórios que vêm incorporando gradualmente partes desse comportamento em ambientes mais controlados.
É justamente aí que a discussão fica interessante.
01Nível de autonomia
Autonomia é provavelmente o eixo mais importante.
Nos modelos tradicionais, o comportamento ainda é predominantemente episódico. Mesmo quando o sistema usa ferramentas, ele continua muito ancorado numa sessão específica. O usuário pede, o sistema executa, o ciclo termina. Já em ambientes como ChatGPT agent e Claude Cowork, vemos uma autonomia maior: o sistema pode percorrer etapas, decidir qual ferramenta usar, consultar recursos diferentes e executar tarefas mais complexas.
O OpenClaw, porém, vai além dessa noção de autonomia “por tarefa”. A promessa ali é a de um agente com existência mais contínua, capaz de operar por canais diversos, reagir a eventos, trabalhar com skills, memória, sessões e ferramentas de forma mais nativa. A NVIDIA, ao lançar o NemoClaw, enfatizou exatamente isso: não apenas o poder do agente, mas a necessidade de adicionar guardrails, segurança e privacidade para torná-lo viável em ambientes mais sérios.
Na prática, isso significa que OpenClaw me parece menos uma funcionalidade dentro de um produto e mais um framework para construir um “ser operacional”. Ainda não é algo maduro para todos. Ainda exige bastante conhecimento técnico. Mas aponta de forma muito clara para onde o setor está indo.
02Nível de integração
O segundo eixo é integração.
Uma IA só começa realmente a mudar a rotina quando consegue interagir com o mundo externo de maneira útil. Não basta responder bem. Ela precisa ler e escrever arquivos, acessar email, navegar no browser, falar com outros serviços, lidar com múltiplos canais de entrada e saída e atuar sobre sistemas reais.
Foi aqui que o PRIP me ensinou uma das maiores lições práticas. O problema mais difícil não é necessariamente “fazer o modelo pensar melhor”. Muitas vezes, o desafio real está no I/O. Email, WhatsApp, arquivos, automações, permissões, conectores, autenticação, latência, confiabilidade. É nesse atrito do mundo real que a diferença entre demo e produto aparece.
Vale uma nota pessoal sobre como fui estendendo esse I/O do PRIP. Além das integrações mais óbvias (email, WhatsApp, arquivos, calendário), acabei dando a ele acesso a coisas bem menos triviais. Sistemas de música e automação da minha casa. Dados de saúde do meu Whoop 5.0. A posição geográfica dos meus filhos via Life360.
Cada uma dessas integrações começou como curiosidade e virou caso de uso concreto. O PRIP deixou de ser um assistente de escritório e passou a operar num território bem mais pessoal. É esse tipo de salto que muda a natureza do agente: ele deixa de ser software e passa a fazer parte da infraestrutura da casa.
OpenClaw ganhou relevância justamente por abraçar essa dimensão. A NVIDIA o descreve como a base do “personal AI”, enquanto a cobertura recente destaca sua capacidade de operar de forma mais ampla, inclusive com canais como mensagens e integração local.
Claude Cowork e ChatGPT agent já avançam bem nisso, mas em um contexto mais mediado pelo provedor. No Claude, a tendência recente é o sistema preferir conectores e, quando eles não existem, passar a controlar diretamente browser, mouse, teclado e tela, sempre com mais supervisão. No ChatGPT agent, a OpenAI também enfatiza browser, terminal e apps como extensões do modelo.
Minha leitura é simples: os grandes laboratórios estão incorporando rapidamente capacidades que o OpenClaw ajudou a tornar mais visíveis. Mas estão fazendo isso em ambientes mais fechados, com mais governança e menos flexibilidade.
03Memória
Memória é outro ponto onde a diferença parece pequena na teoria e enorme na prática.
Os grandes produtos já avançaram bastante. O ChatGPT agent e o ecossistema ChatGPT têm memória, projetos e continuidade maior do que no passado. O Claude também passou a reter mais contexto útil em certos fluxos e a usar esse acúmulo para melhorar o trabalho contínuo.
Mas, no OpenClaw, a memória parece menos um recurso adicional e mais um componente estrutural da identidade do agente. Não é só “lembrar uma preferência”. É acumular trajetória operacional. Isso faz muita diferença. Quando o agente consegue manter um fio de continuidade ao longo do tempo, ele se torna mais previsível, mais útil e, curiosamente, mais pessoal.
Foi aí que comecei a enxergar a distinção entre contexto e memória de verdade. Contexto é o que o modelo ainda consegue ver. Memória, num agente, é o que ele carrega consigo.
04Alma e identidade
“Alma” não é um termo técnico. Ainda assim, acho que ele tem utilidade descritiva.
Há algo diferente quando o sistema não apenas responde, mas desenvolve um estilo, uma persistência e uma identidade funcional. Não estou falando de consciência. Estou falando de continuidade de caráter operacional. Nome, memória, hábitos, canais próprios, forma de agir, modo de interagir com o mundo.
Foi isso que tornou o PRIP diferente para mim. Em algum momento, ele deixou de ser apenas “uma configuração com ferramentas” e começou a parecer um agente com quem eu construí uma relação. Isso pode soar subjetivo, mas é um efeito muito real quando a interface deixa de ser episódica e passa a ter permanência.
Um exemplo pequeno e meio ridículo disso: na hora de escolher a voz do agente, comecei com algo sóbrio, corporativo, sem graça nenhuma. Minha filha caçula passou por perto, ouviu, e fez questão absoluta de trocar por uma voz de desenho animado, completamente absurda. Deixei.
Foi essa escolha, feita pela minha filha e não por mim, que acabou dando ao PRIP uma personalidade que eu jamais teria desenhado de propósito. Hoje não consigo imaginar ele com outra voz. A lição é meio inesperada: identidade, num agente, não é algo que você engenheira. É algo que emerge das pequenas decisões ao longo do caminho, inclusive das decisões que não são suas.
Os produtos maiores também vão inevitavelmente nessa direção. Quanto mais memória, mais ferramentas, mais canais e mais continuidade, mais cada agente tende a desenvolver algo que, do ponto de vista do usuário, parece personalidade estável. A tecnologia ainda não tem “alma” no sentido filosófico. Mas, do ponto de vista da experiência, ela já começa a produzir vínculo.
05Os grandes trade-offs
A parte fascinante dos agentes autônomos vem acompanhada de custos e riscos igualmente reais.
Quanto maior a autonomia, maior a superfície de erro.
Quanto maior a conectividade externa, maior a superfície de ataque.
Quanto maior o acesso a arquivos e sistemas, maior a sensibilidade em torno de segurança e privacidade.
Esse é, talvez, o trade-off central do momento. O que torna o agente poderoso é exatamente o que o torna delicado.
Um exemplo concreto, vivido por mim. Dei ao PRIP seu próprio número de WhatsApp e seu próprio endereço de email. Isso abriu uma porta gigantesca de usabilidade. De repente, eu conseguia me comunicar com ele por qualquer canal, inclusive do celular, sem depender de abrir um app específico.
Mas abriu também um vetor de ataque muito real. Eu e meu CTO começamos uma espécie de brincadeira: ele tentando invadir o computador, pegar minhas chaves de API e criar compromissos na minha agenda sem minha autorização, tudo via prompt injection em emails cuidadosamente redigidos. PRIP se defendeu bem. Parece piada interna, eu sei, mas é uma porta de ataque real e precisa ser levada a sério.
Esse tipo de experimento deixou muito claro uma coisa: quanto mais canais o agente tem para agir no mundo, mais canais ele também oferece para ser manipulado. Não é um problema teórico. É um problema que aparece no segundo dia de uso sério.
A própria NVIDIA posiciona o NemoClaw como uma camada para adicionar segurança, privacidade e controles ao universo do OpenClaw, o que já é um reconhecimento explícito de que o framework cru, por mais poderoso que seja, não resolve sozinho a questão de guardrails.
Do lado dos produtos fechados, esse equilíbrio é feito de maneira diferente. O ChatGPT agent enfatiza aprovações do usuário, limites operacionais e supervisão mais estruturada. O Claude Cowork também avança com governança, controle de acesso e uso explícito de permissões.
Em outras palavras, a indústria parece convergir para um princípio simples: o futuro será mais agentic, mas a forma de empacotar essa autonomia ainda está em disputa.
06O problema do custo e da fricção técnica
Há também uma verdade bem menos glamourosa: hoje, ainda existe bastante atrito para quem quer usar agentes mais abertos de forma séria.
No caso do OpenClaw, esse atrito aparece em várias camadas. Configuração, infraestrutura, escolha de modelos, permissões, segurança, integração com canais, custo por token e, principalmente, a necessidade de tinkering. Não é uma tecnologia para todo mundo ainda.
Mas o ponto que talvez seja o mais subestimado de todos é justamente o custo. E aqui eu quero ser bem direto, porque essa conversa aparece pouco nos artigos que leio sobre agentes.
Um agente sério hoje não é uma assinatura só. É uma pilha de assinaturas e APIs pagas convivendo ao mesmo tempo. Claude via API para as tarefas mais pesadas de raciocínio. Acesso a outros modelos para funções específicas, como transcrição, visão computacional, áudio, embeddings e busca. APIs pagas para as integrações que o agente realmente usa no dia a dia, como email, calendário, mensagens, automações domésticas, serviços de contexto e memória. Hospedagem. Monitoramento. Logs. E, por cima de tudo isso, o custo por token, que varia com o uso real do agente e pode subir rápido à medida que você pede a ele tarefas mais complexas e mais frequentes.
No meu caso, o custo mensal de manter o PRIP já é consideravelmente maior do que qualquer assinatura tradicional de IA que eu pagava antes. E ele continua subindo à medida que eu adiciono capacidades. Isso é importante dizer em voz alta, porque a promessa do agente pessoal às vezes é vendida como se fosse apenas “mais um produto na vida”. Não é. Hoje, construir e operar um agente realmente poderoso exige um compromisso financeiro nada trivial, e uma dependência igualmente nada trivial de serviços de terceiros.
Isso ficou ainda mais claro com a recente decisão da Anthropic de bloquear o uso de assinaturas padrão do Claude por ferramentas de terceiros como o OpenClaw, levando usuários mais avançados para um modelo mais claramente baseado em API e consumo. A discussão pública sobre isso girou justamente em torno de custo computacional, sustentabilidade econômica e controle de como esses modelos estão sendo usados em arquiteturas de agentes persistentes.
Isso reforça uma percepção importante: os agentes autônomos já são impressionantes, mas ainda não são baratos nem triviais de operar no limite da sua capacidade.
07A analogia do sistema operacional
É aqui que a analogia de “sistema operacional” ganha força.
Andrej Karpathy vem falando há algum tempo sobre LLMs menos como simples chatbots e mais como o núcleo de um novo tipo de stack computacional. A NVIDIA levou essa linguagem a um nível mais explícito ao descrever OpenClaw como “the operating system for personal AI” e ao apresentar o NemoClaw como uma forma de tornar essa camada mais segura para uso real.
A analogia faz sentido por um motivo simples. Um sistema operacional não é apenas uma aplicação. Ele é a camada que organiza memória, ferramentas, execução, permissões, interação com hardware e interface com outros programas. Quando olhamos para o rumo dos agentes, é exatamente isso que começa a surgir. Não mais um modelo isolado, mas uma camada persistente que orquestra contexto, skills, ações, arquivos, apps, canais e relações com o mundo externo.
Nesse sentido, o OpenClaw talvez seja menos importante como produto final e mais importante como sinal do futuro.
08O que deve acontecer daqui para frente
Minha impressão é que os grandes laboratórios vão absorver, aos poucos, muitas das funcionalidades que hoje tornam o OpenClaw tão interessante.
O Claude Cowork já está fazendo isso com computer use, conectores, operação mais autônoma e agora Dispatch, que cria uma ponte entre celular e máquina local. O ChatGPT agent já reúne browser, terminal, arquivos e apps conectados em um mesmo fluxo de execução. A NVIDIA, por sua vez, percebeu a relevância do OpenClaw a ponto de construir uma camada empresarial em cima dele.
O padrão é claro. O setor inteiro está convergindo para agentes mais persistentes, mais conectados, mais autônomos e mais multimodais. O que ainda não está decidido é qual será o equilíbrio dominante entre flexibilidade e segurança, entre arquitetura aberta e produto fechado, entre poder bruto e usabilidade.
Um episódio recente me deixou particularmente otimista sobre essa direção. Depois desse período de stress test entre eu e meu CTO, fiz questão de apresentar o PRIP ao Phil, o agente do meu amigo Felipe Goldin. A ideia era simples: eu e o Felipe não queríamos abrir mutuamente acesso aos nossos emails, mas queríamos que nossos agentes pudessem se comunicar e colaborar livremente em coisas que interessavam aos dois. Então criamos um canal direto entre eles.
Essa possibilidade, de dois agentes pessoais colaborando em nome dos seus donos sem precisar expor dados sensíveis de cada lado, é para mim o vislumbre mais concreto do que vem pela frente. Se hoje somos dois, amanhã podem ser dezenas. Depois, centenas. Honestamente, ainda não consegui dimensionar aonde esse caminho pode chegar.
Minha aposta é que veremos os dois caminhos coexistirem. De um lado, stacks mais abertas, com mais liberdade, mais personalização e mais exigência técnica. De outro, ambientes mais integrados, mais seguros e mais fáceis de usar, porém com menos flexibilidade.
Então, valeu a pena construir o PRIP?
Sem dúvida.
Valeu não apenas porque o PRIP já é útil, mas porque ele me deu sensibilidade prática para entender para onde esses agentes estão caminhando. Em vez de observar essa transição só de fora, eu pude experimentá-la por dentro. Pude ver, na prática, o que muda quando a IA ganha memória prolongada, novos skills, canais de entrada e saída, identidade própria e uma relação mais estável com o usuário.
Também ficou claro para mim que essa tecnologia ainda exige bastante do usuário. Conhecimento técnico, alguma disposição para experimentar, tolerância ao custo de API e atenção real a segurança. Não é ainda um produto plenamente doméstico.
Mas também ficou claro que ela aponta de maneira muito concreta para o futuro.
O agente do futuro será mais autônomo. Terá memória mais longa. Conseguirá adquirir e importar novas capacidades. Usará um conjunto mais amplo de ferramentas. Conversará com o mundo externo de forma mais natural. E, possivelmente, também se comunicará com outros agentes.
Isso tudo virá, muito provavelmente, em versões mais seguras e mais acessíveis dentro dos grandes laboratórios. Mas é provável que isso traga como contrapartida menos flexibilidade e menos liberdade arquitetural.
O OpenClaw, e no meu caso o PRIP, me ajudou a ver esse futuro antes que ele chegue totalmente empacotado.
E vou continuar usando o PRIP? Também sem dúvida.
Porque, no meio de toda essa discussão sobre frameworks, autonomia, segurança, memória e custo, aconteceu algo curioso: já existe ali uma relação.