O ano de 2025 foi apontado por muitos como o ano dos “agentes de IA”, e de muitas maneiras, essa previsão tem se concretizado. Empresas líderes como OpenAI e Google, e até mesmo a chinesa Alibaba, têm lançado modelos de IA especializados em tarefas específicas, como busca na web e redação de relatórios. No entanto, um obstáculo significativo permanece: manter esses agentes focados em tarefas que exigem múltiplas etapas ao longo de um período prolongado.
O Problema do Planejamento de Longo Prazo
Testes independentes mostram que mesmo os modelos de IA mais poderosos sofrem com taxas de falha mais altas quanto mais etapas são necessárias para concluir uma tarefa, especialmente se o tempo de execução se estende por horas. A dificuldade reside na dependência do raciocínio reativo, passo a passo, que leva a um comportamento de tentativa e erro, alucinações de planejamento e trajetórias ineficientes.
EAGLET: Um Planejador Global para Agentes de IA
Para enfrentar esse desafio, pesquisadores de diversas universidades e da DeepLang AI desenvolveram o EAGLET, um framework acadêmico que visa melhorar o desempenho de agentes baseados em LLM (Large Language Models) em tarefas de longo prazo. A grande sacada é que o EAGLET faz isso sem a necessidade de rotulagem manual de dados ou retreinamento dos modelos existentes.
EAGLET introduz um “planejador global” que se integra aos fluxos de trabalho dos agentes, com o objetivo de reduzir alucinações e aumentar a eficiência. Esse planejador é um modelo de linguagem ajustado que interpreta as instruções da tarefa e gera um plano de alto nível para o agente executor (que, por sua vez, é alimentado por seu próprio LLM). O EAGLET não interfere durante a execução, mas sua orientação inicial ajuda a diminuir erros de planejamento e elevar as taxas de conclusão de tarefas.
Como Funciona o Treinamento do EAGLET
Uma das características notáveis do EAGLET é seu processo de treinamento em duas etapas, que dispensa anotações humanas. Na primeira etapa, planos sintéticos são gerados utilizando LLMs avançados, como GPT-5 e DeepSeek-V3.1-Think. Em seguida, esses planos são filtrados por meio de uma estratégia inovadora chamada “filtragem de consenso homólogo”, que retém apenas os planos que melhoram o desempenho da tarefa, tanto para agentes executores experientes quanto para novatos.
Na segunda etapa, um processo de reforço de aprendizado baseado em regras refina ainda mais o planejador, utilizando uma função de recompensa personalizada para avaliar o quanto cada plano ajuda múltiplos agentes a terem sucesso. Essa recompensa é calculada através do ECGR (Executor Capability Gain Reward), que mede o valor de um plano com base em sua capacidade de auxiliar agentes de alta e baixa capacidade a concluírem tarefas com sucesso e em menos etapas.
Resultados Promissores em Benchmarks
O EAGLET foi testado em três benchmarks amplamente utilizados para tarefas de longo prazo: ScienceWorld (simulação de experimentos científicos em um laboratório textual), ALFWorld (tarefas domésticas em um ambiente simulado) e WebShop (compras online). Em todos os três, os agentes equipados com o EAGLET superaram seus pares sem planejamento e outras soluções de planejamento existentes.
Por exemplo, em experimentos com o modelo de código aberto Llama-3.1-8B-Instruct, o EAGLET elevou o desempenho médio de 39,5 para 59,4 – um ganho de 19,9 pontos. Em cenários não vistos no ScienceWorld, o desempenho subiu de 42,2 para 61,6. No ALFWorld, o EAGLET melhorou os resultados de 22,9 para 54,3, um aumento de mais de 2,3 vezes no desempenho. Ganhos ainda maiores foram observados com modelos mais avançados, como o GPT-4.1 e o GPT-5.
O Futuro dos Agentes de IA e o Papel do Planejamento
O EAGLET representa um avanço significativo na busca por agentes de IA mais confiáveis e eficientes, capazes de lidar com tarefas complexas que exigem planejamento estratégico e execução coordenada. Ao separar o planejamento da ação e utilizar um processo de treinamento sem anotações humanas, o EAGLET oferece uma abordagem promissora para superar as limitações dos modelos existentes.
Embora ainda não haja uma implementação de código aberto disponível, o EAGLET já demonstra seu potencial para transformar a forma como os agentes de IA são desenvolvidos e utilizados em diversas aplicações. Resta acompanhar os próximos passos e ver como essa tecnologia será adotada e adaptada pela comunidade de pesquisa e pela indústria.