Парсинг джоб-бордов без блокировки на 50 сохранениях
В 2026 году парсинг джоб-бордов стал одной из самых сложных задач в открытом вебе. Рассказываем, что изменилось и как команды по анализу рынка труда продолжают собирать данные.
Читать далее →Обновления продуктов, техническая аналитика и анализ индустрии от FourA, интеллектуальной платформы сбора данных.
В 2026 году парсинг джоб-бордов стал одной из самых сложных задач в открытом вебе. Рассказываем, что изменилось и как команды по анализу рынка труда продолжают собирать данные.
Читать далее →foura.ai теперь доступен на шести языках: маршрутизация с префиксами URL, SEO с учетом локали и hreflang, а также карта сайта XSLT, которая отображается в браузерах как стилизованная таблица.
Указывайте, какие ответы считать успешными, с помощью правил validate. Принятые вами ответы с кодами, отличными от 200, теперь тарифицируются корректно и отображаются как успешные в ленте Activity.
Маркетплейс pay-per-crawl от Cloudflare и HTTP 402 разделяют веб на лицензионные и открытые данные. Рассказываем, что изменится для команд, собирающих веб-данные в 2026 году.
Страницы в кодировках, отличных от UTF-8, возвращают читаемый текст в Single вместо кракозябр, правила validate определяют классификацию успешных запросов, и внедрено повышение безопасности Wave 0.
База знаний RAG устаревает уже через неделю после запуска. Рассказываем, как команды выполняют рекроулинг сотен вертикальных источников без ущерба для инженерного бюджета.
Нажмите на любую строку в Activity, чтобы увидеть полный payload, и откройте ее в Playground с уже заполненными данными. Новая защита от honeypot перехватывает proxy, возвращающие эхо запроса в качестве ложного ответа.
Firecrawl берет в 5 раз больше за извлечение данных с помощью LLM по сравнению с обычным скрапингом. На объемах в 100 тысяч страниц в день экономика рушится. Разбираемся, когда извлечение через LLM оправдывает затраты, а когда нет.
Созданные на этой неделе ключи API теперь можно просматривать. Dashboard запоминает их, генератор curl в песочнице автоматически подставляет их, а медленные запросы теперь можно отменять.
KORENA создала ежедневный европейский индекс цен на древесину на основе лесных порталов, PDF-файлов аукционов и десяти валют. FourA служит слоем request для этого проекта.