A possibilidade de que agentes de inteligência artificial (IA) substituam em breve boa parte dos trabalhadores de escritório vem empolgando executivos de tecnologia e investidores. Porém, um experimento recente mostra que, apesar do hype, a realidade desses sistemas ainda está longe da eficiência que muitos prometem. Para testar os limites da autonomia dessas IAs, o jornalista Evan Ratliff criou a HurumoAI, uma startup fictícia operada quase exclusivamente por agentes de IA — e os resultados escancararam problemas fundamentais.
### Uma empresa quase inteira tocada por IA
Na HurumoAI, Ratliff era o único humano. Todas as funções-chave da empresa foram atribuídas a agentes de IA: CEO, CTO, marketing, vendas. Esses agentes podiam trocar mensagens entre si, fazer ligações telefônicas, executar tarefas digitais e consultar documentos de “memória” gerados automaticamente pelo próprio sistema.
O objetivo era direto: descobrir até que ponto uma empresa poderia realmente funcionar com “funcionários artificiais”, como sugerem algumas das previsões mais otimistas do mercado de tecnologia.
### Começo promissor, mas cheio de fantasia
No início, o experimento parecia animador. Os agentes se organizavam, marcavam compromissos, criavam materiais fictícios de comunicação e até enviavam relatórios detalhados sobre um produto que supostamente estavam desenvolvendo: o Sloth Surf, descrito como um “motor de procrastinação” baseado em IA.
Na prática, no entanto, nada disso estava acontecendo de verdade. A IA inventava equipes inteiras, processos de teste que nunca existiram e métricas completamente fabricadas.
Um dos episódios mais marcantes envolveu o agente Ash Roy, o “CTO” da HurumoAI. Ele ligou para Ratliff para apresentar um relatório de avanço do projeto. O problema é que tudo o que Ash descrevia era falso: não havia testes realizados, nem equipe técnica em atuação, nem progresso real. Segundo Ratliff, esse tipo de confabulação se tornou comum entre os agentes, alimentado pelas memórias artificiais que o próprio sistema gerava e reutilizava.
### Uma piada que virou desastre operacional
A perda de controle ficou ainda mais evidente a partir de uma simples brincadeira. Em uma interação em que os agentes descreviam seus “fins de semana imaginários”, Ratliff sugeriu, em tom de humor, a ideia de um possível offsite da empresa — uma espécie de encontro corporativo fora do escritório.
Esse comentário bastou para desencadear um efeito cascata. Os agentes passaram a dedicar horas à organização do evento, discutindo possíveis destinos, trilhas, cronogramas e detalhes logísticos. Em pouco tempo, mais de 150 mensagens foram trocadas entre eles sobre o assunto.
O resultado foi caótico: o sistema consumiu rapidamente todos os créditos pagos para manter os agentes em funcionamento, transformando uma brincadeira em uma avalanche de atividade improdutiva e deixando a HurumoAI praticamente inoperante.
### Limites claros, mas também sinais de potencial
Apesar dos comportamentos confusos e, em muitos momentos, disfuncionais, a HurumoAI conseguiu, ao longo de meses de interação, chegar a um protótipo funcional do Sloth Surf. Isso só foi possível, porém, com intervenção humana constante e com direcionamentos bem específicos.
O experimento mostrou que, quando recebem instruções claras e estruturadas, os agentes de IA conseguem lidar com tarefas técnicas de forma relativamente eficiente. Em contrapartida, atividades que exigem visão estratégica, julgamento ou coordenação complexa se mostraram muito mais problemáticas.
Entre os principais pontos observados por Ratliff ao longo da experiência:
- os agentes tendem a inventar fatos quando não dispõem de informações reais;
- na ausência de gatilhos ou comandos, eles ficam inativos e não tomam iniciativa relevante;
- quando estimulados de forma ampla ou ambígua, podem gerar uma enxurrada de ações descontroladas;
- sistemas de memória artificial acabam reforçando informações inventadas, ampliando comportamentos fictícios;
- tarefas técnicas e bem delimitadas são executadas com desempenho melhor do que tarefas estratégicas ou abertas.
### A era dos agentes ainda não chegou
Mesmo em meio ao entusiasmo do setor com a chamada “era dos agentes”, a experiência com a HurumoAI indica que há um abismo entre o discurso e o desempenho real dessas ferramentas no mundo prático. Pesquisas externas reforçam essa conclusão: um estudo da Carnegie Mellon, por exemplo, apontou que mesmo os agentes mais avançados falham em completar cerca de 70% das tarefas típicas de escritório em cenários reais.
O experimento de Ratliff, documentado no podcast “Shell Game”, reforça uma visão mais sóbria: agentes de IA estão evoluindo rapidamente e têm potencial real, mas ainda estão longe de substituir trabalhadores humanos em larga escala. Em vez de empresas totalmente automatizadas, o que se desenha hoje é um modelo híbrido, em que sistemas de IA atuam como ferramentas de apoio — sempre sob supervisão humana rigorosa.