Инженер открывает Dawn и запрашивает: "Собери данные с https://topstartups.io/ и выдай мне первые 10 стартапов, включая названия, описания, штаб-квартиру, год основания, URL, страницы в соцсетях, в виде таблицы".
Агент думает секунду, загружает страницу, парсит список, переходит по профилю каждого стартапа и возвращает таблицу. Десять строк. Каждая колонка заполнена. Pogo, Auctor, Scalify, Omnea, Rivan, Listen Labs, Doppel, Blossom, Avoca, Traba. Штаб-квартиры в Бруклине, Нью-Йорке, Лондоне, Сан-Франциско, удаленно. У большинства указан LinkedIn. Годы основания с 2020 по 2026.
Эта таблица стала результатом всего нескольких вызовов FourA.
На этой неделе Dawn интегрировала FourA как инструмент первого класса в свою платформу агентов. Он находится в сетке интеграций рядом с Notion, GitHub и Google Drive. Агенты с доступом к FourA могут загружать публичные веб-страницы или HTTP-endpoint, парсить response (включая JSON), отправлять формы, проверять доступность и извлекать конкретный текст или ссылки из полученных данных. У каждого агента либо есть явный доступ, либо его нет. Управление на уровне отдельных агентов исключает риск бесконтрольного доступа в интернет для всех подряд.
Интересно здесь не то, что агент может обратиться к URL. Веб-поиск существует в платформах агентов уже год. Интересен сам формат инструмента, который сейчас формируется.
Веб-поиск и экстракция данных по URL, это разные задачи. Поиск нужен для ответа на вопрос "что пишут в интернете про X?". Это широкая, генеративная информация на уровне сводки. Экстракция нужна для задачи "вот URL или endpoint, загрузи его и дай структурированный ответ". У них разные требования к надежности, разные профили затрат и разные сценарии сбоев. Смешивание их в одном инструменте приводит к посредственным результатам в обоих случаях.
Интеграция Dawn разделяет эти задачи. Для широкого поиска у них есть функция /web-research. FourA используется для точечной работы. Агент выбирает нужный инструмент в зависимости от текущей потребности. И это паттерн зрелости, который мы начинаем наблюдать на платформах агентов в 2026 году: экстракция перерастает формат "прикрученного сбоку поиска" и становится самостоятельным примитивом.
Для инженеров платформ
Dawn предоставляет FourA в виде восьми именованных инструментов, каждый из которых соответствует популярному паттерну экстракции:
foura_fetch_pageдля HTML и текстовых страницfoura_extract_textдля чистого, читаемого контентаfoura_extract_linksдля навигации, форм, скриптов и стилейfoura_fetch_jsonдля API endpointsfoura_head_urlдля заголовков, статусов и редиректовfoura_probe_siteдля быстрой проверки доступностиfoura_submit_formдля отправки форм без авторизацииfoura_single_requestдля произвольных HTTP-запросов
Агент выбирает инструмент в зависимости от задачи. Запрос к topstartups, описанный выше, использовал три из них последовательно: загрузку, экстракцию и переход по ссылкам.
Такую интеграцию реально сделать за день. Под капотом работают два типа запросов: прямой режим с фингерпринтами браузерного уровня для сайтов без агрессивных блокировок и режим с маршрутизацией через proxy для всего остального. Оба используют одинаковую структуру запроса: URL, необязательные headers и body, а также опциональный парсинг response. Агент делает выбор исходя из требований целевого сайта.
Контракт, который платформа предлагает своим агентам, обычно выглядит так:
- Небольшой набор возможностей (fetch / extract / probe / submit), каждая из которых имеет чёткое описание инструмента, доступное агенту
- Использование режима proxy по умолчанию с переходом на прямой режим, когда важны задержка или стоимость
- Разрешения на уровне отдельных агентов, чтобы клиенты платформы сохраняли контроль
- Структурированный парсинг response, вынесенный в параметры инструмента, а не зашитый в системный промпт
Но деталь, которую недооценивают большинство инженеров платформ, это пограничные случаи. Простые 80% случаев, когда загрузка завершается за 200 мс и возвращает чистый HTML, это легкая часть. Остальные 20% (сайты, блокирующие по TLS-фингерпринту, подсовывающие JS-челленджи в response или отдающие 403 ошибку из-за блокировки облачных IP) определяют, выдаст ли ваш агент правильный ответ или галлюцинацию. Мы перестроили наш путь обработки запросов именно под эти сложные случаи, и разница между "кажется надежным" и "действительно надежно" составляет большую часть работы.
Так что если вы развиваете платформу агентов и ваши клиенты постоянно спрашивают, как их агентам "просто проверить этот URL", то вот готовый паттерн. Документация доступна по адресу /docs. Мы с радостью поможем вам во всем разобраться.
Для всех остальных
Вы всего этого не увидите. Вы просто заметите, что когда вы задаете ИИ-ассистенту вопрос, требующий изучения реальной веб-страницы прямо сейчас, он отвечает правильно вместо того, чтобы гадать или извиняться.
Это видимый пользователю результат работы примитива экстракции, который достаточно надежен, чтобы находиться рядом с GitHub и Google Drive в сетке интеграций. Технология перестает быть исследовательским проектом и становится базовой инфраструктурой.
Почему это важно
Еще полгода назад агент, которому требовалось прочитать веб-страницу, представлял собой кастомную сборку. Уникальные промпты, хрупкие парсеры, самописные повторные попытки, в лучшем случае 60% успешных запросов. Формат был неподходящим, потому что нужного слоя абстракции еще не существовало. А целевые сайты постоянно менялись. Технологии защиты от ботов перешли от статических сигналов к поведенческому анализу, поэтому собранные на коленке парсеры ломались быстрее, чем команды успевали их чинить.
Теперь этот слой формируется. Dawn подхватила тренд и выпустила интеграцию. Мы ожидаем, что в этом году за ней последуют и другие платформы агентов, а сам контракт стандартизируется: отдельный инструмент для поиска, отдельный инструмент для экстракции, управление на уровне агентов, предсказуемая стоимость.
Мы в самом начале пути. Но именно так выглядит зарождение нового стандарта. Когда технология перестает быть отдельным проектом и становится готовым модулем.
Если вы создаете платформу агентов и хотите реализовать такую же архитектуру, напишите нам. Если вы создаете агентов на Dawn, FourA уже доступен. Просто включите его.