Um engenheiro abre o Dawn e pergunta: "Faça o scrape de https://topstartups.io/ e me dê as primeiras 10 startups, incluindo nomes, descrições, sede, ano de fundação, URLs, páginas sociais, formatado como uma tabela."
O agente pensa por um momento, busca a página, analisa os resultados, segue o perfil de cada startup e retorna a tabela. Dez linhas. Todas as colunas preenchidas. Pogo, Auctor, Scalify, Omnea, Rivan, Listen Labs, Doppel, Blossom, Avoca, Traba. Sedes em Brooklyn, Nova York, Londres, São Francisco, Remoto. LinkedIn para a maioria. Anos de fundação de 2020 a 2026.
Essa tabela foi o resultado de algumas chamadas do FourA.
Esta semana, o Dawn lançou o FourA como uma ferramenta de primeira classe dentro de sua plataforma de agentes. Ele fica na grade de integrações ao lado do Notion, GitHub e Google Drive. Agentes com acesso concedido ao FourA podem buscar uma página web pública ou endpoint HTTP, analisar a response (incluindo JSON), enviar um formulário, verificar a acessibilidade e extrair textos ou links específicos do que retorna. Cada agente tem acesso explícito ou não tem. Governança por agente, sem o risco de "dar a internet inteira para todos os agentes".
O que é interessante não é o fato de um agente poder acessar uma URL. A busca web já existe em plataformas de agentes há um ano. O que é interessante é o modelo de ferramenta que está surgindo.
Busca web e extração de URL são tarefas diferentes. A busca serve para "o que a internet diz sobre X?" Informações amplas, generativas, em nível de resumo. A extração serve para "aqui está a URL ou endpoint, busque-o e me dê a resposta estruturada." Requisitos de confiabilidade diferentes, perfis de custo diferentes, modos de falha diferentes. Misturá-los em uma única ferramenta gera uma resposta medíocre para ambos.
A integração do Dawn os trata de forma separada. Eles têm uma funcionalidade /web-research para a tarefa ampla. O FourA é para a tarefa direcionada. O agente escolhe a ferramenta certa com base no que ele realmente precisa. E esse é o padrão de maturação que estamos começando a ver nas plataformas de agentes em 2026: a extração está deixando de ser uma "busca improvisada" para se tornar sua própria primitiva.
Para o engenheiro de plataforma que está lendo isto
O Dawn expõe o FourA como oito ferramentas nomeadas, cada uma mapeando para um padrão de extração comum:
foura_fetch_pagepara páginas HTML e de textofoura_extract_textpara conteúdo limpo e legívelfoura_extract_linkspara navegação, formulários, scripts e estilosfoura_fetch_jsonpara endpoints de APIfoura_head_urlpara headers, status, redirecionamentosfoura_probe_sitepara verificações rápidas de acessibilidadefoura_submit_formpara envios de formulários sem loginfoura_single_requestpara HTTP arbitrário
O agente escolhe com base no que a pergunta exige. A consulta do topstartups acima usou três delas em sequência: um fetch, um extract, um follow-up.
A integração é simples o suficiente para ser feita em um dia. Por baixo, existem duas variantes de request: um modo direto com fingerprinting de nível de navegador para sites que não bloqueiam agressivamente, e um modo roteado por proxy para todo o resto. Ambos compartilham o mesmo formato de request: URL, headers e body opcionais, e parsing opcional de response. O agente escolhe com base no que o site de destino exige.
O contrato que uma plataforma oferece aos seus agentes costuma ser assim:
- Um pequeno conjunto de recursos (fetch / extract / probe / submit), cada um com uma definição de ferramenta focada que o agente pode utilizar
- Padrão para o modo proxy, recorrendo ao modo direto quando a latência ou o custo forem importantes
- Permissão por agente para que os clientes da plataforma mantenham a governança
- Parsing estruturado de response exposto como um parâmetro de ferramenta, não oculto em um prompt do sistema
Mas a parte que a maioria dos engenheiros de plataforma subestima é o que acontece nos casos extremos. O caso dos 80% (um fetch bem-sucedido em 200ms, retornando HTML limpo) é a metade fácil. Os outros 20% (sites que bloqueiam por fingerprint de TLS, que inserem um desafio de JS na response, que retornam 403 em blocos de IP de nuvem) é o que determina se o seu agente entrega uma resposta correta ou uma alucinada. Nós reconstruímos nosso caminho de request exatamente para esses casos extremos, e a diferença entre "parece confiável" e "realmente confiável" exige a maior parte do trabalho.
Então, se você gerencia uma plataforma de agentes e seus clientes continuam perguntando como seus agentes poderiam "apenas verificar esta URL", esse é o padrão. A documentação está em /docs. Teremos prazer em ajudar você nesse processo.
Para todos os outros
Você não verá nada disso. Apenas notará que, quando fizer a um assistente de IA uma pergunta que exija consultar uma página web real agora mesmo, ele responderá corretamente em vez de adivinhar ou pedir desculpas.
Esse é o resultado visível para o usuário de uma primitiva de extração confiável o suficiente para estar ao lado do GitHub e do Google Drive em uma grade de integrações. Deixa de ser um projeto de pesquisa. Passa a ser infraestrutura básica.
Por que isso importa
Há seis meses, um agente que precisava ler uma página web era um desenvolvimento sob medida. Prompts personalizados, scrapers frágeis, retries manuais, uma taxa de sucesso de 60% em um dia bom. O formato estava errado porque a camada ainda não existia. E os sites que o agente acessava mudavam constantemente. A tecnologia anti-bot passou de sinais estáticos para verificações comportamentais, de modo que os scrapers improvisados quebravam mais rápido do que as equipes conseguiam corrigi-los.
Agora a camada está se formando. O Dawn a adotou e lançou uma integração. Esperamos que mais plataformas de agentes sigam o mesmo caminho este ano, e que o contrato convirja: uma ferramenta dedicada para busca, uma ferramenta dedicada para extração, governança por agente, custo previsível.
Estamos no início. Mas é assim que se parece o surgimento de algo. Quando um recurso deixa de ser um projeto e passa a ser um plugue.
Se você desenvolve uma plataforma de agentes e quer entregar o mesmo modelo, fale conosco. Se você desenvolve agentes no Dawn, o FourA já está lá. Basta ativá-lo.