Gestión de protección anti-bot

Los sitios web modernos utilizan detección avanzada de bots. Esta guía explica cómo FourA gestiona los sistemas anti-bot y cómo maximizar su tasa de éxito.

Cómo funciona la detección de bots

Los sitios web utilizan varias capas de protección:

  • Reputación de IP: Los centros de datos y las IP de proxy conocidas se bloquean
  • Wire fingerprinting: Cada cliente HTTP tiene una firma de handshake única que los sitios pueden detectar
  • Browser fingerprinting: JavaScript busca indicadores de navegadores headless
  • Análisis de comportamiento: Patrones de request, tiempos y flujo de navegación
  • CAPTCHAs: Desafíos visuales como última línea de defensa

Los proveedores anti-bot comunes incluyen Cloudflare, DataDome, PerimeterX y Akamai Bot Manager.

Cómo ayuda FourA

Requests realistas a nivel de red

El endpoint único (POST /api/single/) emite características de handshake que coinciden con las de un navegador real. Esto supera las comprobaciones a nivel de red más comunes sin la sobrecarga de ejecutar un navegador completo.

Active unblocker para inyectar también headers de navegador realistas (User-Agent, Sec-Ch-Ua, Sec-Fetch-*, Accept-Encoding):

{
  "method": "GET",
  "url": "https://protected-site.com/data",
  "unblocker": true
}

Renderizado con navegador real

El endpoint de navegador (POST /api/browser/) ejecuta una instancia completa del navegador Chrome. En combinación con parches anti-detección, supera la mayoría de las comprobaciones de fingerprint basadas en JavaScript.

Rotación de proxy

El endpoint de proxy (POST /api/proxy/) rota automáticamente entre proxies residenciales y de centros de datos. Si una IP se bloquea, el siguiente intento utiliza una diferente.

Estrategia por nivel de protección

Protección baja (la mayoría de los sitios)

Utilice el endpoint único con unblocker. La coincidencia a nivel de red es suficiente.

curl -X POST https://eu.api.foura.ai/api/single/ \
  -H "X-API-Key: YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"method": "GET", "url": "https://news-site.com/article", "unblocker": true}'

Protección media (Cloudflare, WAF básico)

Utilice el endpoint de navegador para superar los desafíos de JavaScript:

curl -X POST https://eu.api.foura.ai/api/browser/ \
  -H "X-API-Key: YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://protected-site.com/data", "timeout_ms": 15000}'

Protección alta (DataDome, PerimeterX)

Utilice el endpoint de proxy con múltiples intentos de reintento:

curl -X POST https://eu.api.foura.ai/api/proxy/ \
  -H "X-API-Key: YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "maxTries": 10,
    "request": {
      "method": "GET",
      "url": "https://heavily-protected.com/prices",
      "unblocker": true
    }
  }'

Para cadenas de WAF de nivel 1 (Vercel Security Checkpoint, Cloudflare "Just a moment", Akamai Bot Manager) donde necesite la página renderizada después de que se resuelva el desafío, consulte la receta de desafío WAF para ver el patrón encadenado de proxy → browser.

Buenas prácticas

  1. Comience de forma sencilla, escale gradualmente. Pruebe primero el endpoint único. Cambie al navegador o proxy solo cuando sea necesario.

  2. Respete los rate limits. Incluso con la rotación de proxy, enviar cientos de requests por segundo a un solo sitio activará la detección de comportamiento. Espacie sus requests al menos de 1 a 2 segundos.

  3. Use unblocker. Para requests únicos y de proxy, active unblocker para inyectar automáticamente headers de navegador realistas en lugar de configurar manualmente las cadenas de User-Agent.

  4. Monitoree las tasas de éxito. Verifique las métricas del Dashboard para realizar un seguimiento de su tasa de éxito a lo largo del tiempo. Una caída repentina suele significar que el sitio de destino actualizó su protección.

  5. Aumente maxTries para objetivos difíciles. El endpoint de proxy tiene un valor predeterminado de 5 intentos, pero puede configurar hasta 90 para sitios altamente protegidos.

Lo que FourA no puede evadir

Algunos escenarios requieren una gestión adicional fuera de la API:

  • Contenido protegido por inicio de sesión: FourA no gestiona sesiones ni cookies entre requests (el endpoint de navegador admite la configuración de cookies por request)
  • CAPTCHAs interactivos: reCAPTCHA v3 y hCaptcha requieren servicios de resolución
  • Listas de permitidos de países / ASN: los sitios con licencia nacional (casas de apuestas en línea, algunos servicios gubernamentales) solo aceptan tráfico de un conjunto reducido de ISP. La rotación de proxy no ayudará; necesitará una fuente de datos diferente.
  • Sitios con restricciones legales: Asegúrese siempre de que su recopilación de datos cumpla con los términos de servicio del sitio de destino y las leyes aplicables

Próximos pasos

Actualizado: 20 de mayo de 2026