Como uma empresa de inteligência de preços monitora 10.000 SKUs diariamente

A inteligência de preços é a espinha dorsal do e-commerce competitivo. Empresas que monitoram preços de concorrentes em tempo real podem ajustar seus próprios preços de forma dinâmica, proteger margens e capturar fatia de mercado. Mas construir um sistema que monitora de forma confiável 10.000 páginas de produtos todos os dias é um desafio sério de engenharia.

Este artigo explica como funciona uma operação típica de inteligência de preços, os obstáculos técnicos envolvidos e como APIs de coleta de dados como a FourA simplificam a camada de infraestrutura.

A escala do problema

Uma empresa de inteligência de preços de médio porte pode monitorar:

10.000 SKUs em 50 sites concorrentes
3 verificações de preço por SKU por dia (manhã, tarde, noite)
Isso representa 30.000 buscas de páginas diariamente, em sites com diferentes layouts, sistemas de proteção e requisitos de renderização

Nessa escala, você não pode se dar ao luxo de fazer manutenção manual. Cada seletor quebrado, IP bloqueado ou redesign de site custa horas de engenharia e gera lacunas nos seus dados.

Arquitetura

1. Catálogo de produtos

O sistema começa com um catálogo estruturado: identificadores de SKU mapeados para URLs concorrentes e seletores CSS para elementos de preço.

{
  "sku": "LAPTOP-X1-16GB",
  "targets": [
    {"site": "competitor-a.com", "url": "https://competitor-a.com/laptop-x1", "selector": ".price-current", "type": "single"},
    {"site": "competitor-b.com", "url": "https://competitor-b.com/products/12345", "selector": "[data-price]", "type": "browser"},
    {"site": "competitor-c.com", "url": "https://competitor-c.com/item/laptop-x1", "selector": ".product-price", "type": "proxy"}
  ]
}

Observe os diferentes tipos de tarefas por alvo. Cada site possui características diferentes.

2. Pipeline de coleta

Um scheduler dispara tarefas de coleta em lotes. Cada tarefa chama a API da FourA:

import requests
import time

def collect_price(target):
    resp = requests.post("https://eu.api.foura.ai/api/v1/tasks", headers={
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json"
    }, json={
        "url": target["url"],
        "type": target["type"],
        "options": {"waitFor": target["selector"]} if target["type"] == "browser" else {}
    })
    return resp.json()

O ponto principal: a FourA lida com rotação de proxy, TLS fingerprinting, renderização de browser e lógica de retry. O pipeline de coleta só precisa enviar URLs e fazer o parse das responses.

3. Extração e normalização de preços

O HTML bruto passa por um parser que extrai o valor do preço, normaliza a moeda e lida com casos especiais (preços promocionais, faixas de preço "a partir de", indicadores de falta de estoque).

4. Detecção de alterações e alertas

Cada novo preço é comparado com a leitura anterior. Alterações significativas (geralmente um limite de 2-5%) disparam alertas para analistas ou sistemas automatizados de precificação.

Principais desafios

Complexidade específica de cada site: Cada site concorrente tem um layout, nível de proteção e comportamento de renderização únicos. Uma abordagem única para todos falha rapidamente.

Atualização dos dados: Preços desatualizados são piores do que a ausência de preços. O sistema deve concluir sua coleta diária dentro da janela de tempo, o que significa lidar com falhas e retries de forma eficiente.

Gestão de custos: Com 30.000 requests por dia, os custos de infraestrutura se acumulam. Usar o tipo de tarefa correto para cada alvo (single quando possível, browser apenas quando necessário) reduz os custos significativamente.

Por que APIs superam soluções próprias

Uma empresa que construísse isso internamente precisaria manter pools de proxy, farms de browsers e código anti-detecção para cada site alvo. Esse custo indireto de infraestrutura é o custo real. Não é o tempo de engenharia para escrever o scraper inicial; é a manutenção contínua para mantê-lo funcionando.

APIs de coleta de dados como a FourA absorvem essa complexidade. A empresa foca no que realmente a diferencia (catálogo de produtos, algoritmos de precificação, relacionamento com clientes) em vez de manter o Chrome atualizado.

As empresas que estão saindo na frente em inteligência de preços não são as que têm as maiores equipes de scraping. São aquelas que pararam de construir infraestrutura e começaram a criar modelos de precificação melhores. É aí que reside a verdadeira vantagem competitiva.

Saiba mais no guia prático e na referência da API.