Os dados de preços de madeira na Europa são tecnicamente públicos, mas praticamente inutilizáveis. Um país lista os preços do carvalho em Euros por metro cúbico, sem impostos. Uma nação vizinha compartilha os preços da faia em moeda local, com impostos incluídos, enterrados dentro de um PDF digitalizado sem camada de texto pesquisável. Para piorar a situação, árvores em pé, toras à beira da estrada e lotes de leilão selecionados são frequentemente cotados lado a lado como se fossem produtos idênticos.
Os dados brutos existem. A inteligência de mercado não.
A KORENA lançou o KORENA Timber Index para corrigir isso. O resultado é uma referência diária e de livre acesso para preços de madeira de lei, madeira serrada e pranchas na Europa. Em meados de 2026, o índice monitora cerca de duas dúzias de espécies e 170 linhas de preços regionais em dez países (Romênia, Alemanha, Bulgária, Polônia, França, Áustria, Itália, Finlândia, Noruega, Suécia), além de um nível de mercado pan-europeu.
Para uma equipe de engenharia de duas pessoas cobrir tanto terreno, a KORENA precisava resolver uma decisão logo de início: quem cuidaria da web. Eles escolheram a FourA e rotearam tudo por meio dela.
Um único gateway para a web
A KORENA fez uma escolha de arquitetura logo no início: cada request web externo passa pela FourA. Eles se livraram de scrapers perdidos, scripts pontuais e comandos personalizados ocultos no codebase.
Não era por conveniência. Era por consistência. Os portais florestais se comportam de maneira imprevisível. Alguns são páginas HTML estáticas. Outros são plataformas de leilão modernas que só exibem dados após a renderização de um navegador. Os sites governamentais costumam ser lentos, desatualizados ou fortemente protegidos.
Ao rotear todo o tráfego pela infraestrutura de request da FourA, a KORENA lida com retentativas, backoff, logging e alertas da mesma forma em todas as fontes. E cada documento recuperado pode ter seu hash gerado, ser armazenado e rastreado até seu preço final para auditoria.
Escolhendo a estratégia de busca certa por fonte
Em de vez de codificar a lógica de scraping diretamente para cada site, a KORENA mapeia cada fonte de dados para um endpoint específico da FourA diretamente em seu banco de dados (consulte escolhendo o tipo de tarefa correto para obter o detalhamento completo). Eles podem mudar de estratégia sem tocar no código principal de parsing:
Single (
/single/): páginas HTML estáticas, feeds XML e downloads diretos de PDF. Relatórios estatísticos alemães, atualizações florestais estatais búlgaras, tabelas de preços romenas. Rápido, leve, o padrão ideal para a maioria dos sites.Browser (
/browser/): aplicações web interativas que precisam de um contexto de navegador real. A plataforma de leilões e-Drewno da Polônia exige renderização antes que os números apareçam. O HTML inicial não tem nada útil.Proxy Finder (
/proxy/): a alternativa para os alvos mais difíceis. Rotação mais forte, além deunblocker: truepara barreiras anti-bot no nível de handshake.
Como essa é uma configuração por fonte e não um script codificado, a KORENA pode mover uma fonte de Single para Browser e para Proxy Finder quando um site altera suas defesas. A camada de parsing nunca vê isso.
PDFs digitalizados: a parte mais difícil
As APIs web modernas são diretas. O caso mais difícil de automatizar são os PDFs apenas com imagens. Listas de preços e resultados de leilões publicados como digitalizações, sem nenhuma camada de texto. Para um humano, isso é irritante. Para um índice diário, isso interrompe o pipeline.
O pipeline da KORENA lida com eles por meio de uma divisão clara de trabalho:
Recuperação: a FourA baixa os bytes brutos do PDF, diariamente, de forma confiável.
Avaliação de texto: a KORENA verifica se o arquivo possui uma camada de texto nativa utilizável.
Processamento e extração: se o PDF for uma imagem simples, a KORENA rasteriza as páginas e as processa por meio de OCR e extração de documentos por IA, aplicando dicas de idioma personalizadas e dicionários de espécies para capturar a terminologia florestal local.
Validação de esquema: a saída é validada em relação ao mesmo esquema de todas as outras fontes.
Nada disso funciona se você não conseguir buscar o documento de forma confiável todos os dias. Essa é a etapa que pertence à FourA.
Buscar vs. compreender: uma divisão clara
O trabalho da FourA é entregar bytes brutos de forma confiável. Ela não precisa saber nada sobre madeira. Isso permite que a KORENA foque 100% de sua energia no que ela realmente sabe: transformar dados caóticos em um índice padronizado. Tudo o que é específico do domínio fica com a KORENA. O HTML é analisado localmente, os PDFs digitais são lidos com pdfjs-dist e os PDFs digitalizados são processados via OCR.
A etapa de normalização é onde os números brutos se tornam um índice. O preço de uma árvore em pé não é o preço de uma tora de serraria, e o resultado de um leilão local com IVA incluído não é diretamente comparável a uma cotação de exportação sem IVA. Para transformar números brutos em inteligência de mercado comparável, a KORENA converte todos os dados em um único padrão: Euros por metro cúbico, sem IVA, equivalente a entregue.
Para fazer isso com precisão, o sistema leva em consideração:
- Taxas de câmbio diárias do Banco Central Europeu.
- Regras locais de IVA de cada país.
- Fatores de transporte baseados no estágio do produto de madeira.
O índice também mantém separados os diferentes níveis de mercado. Madeira em tora a granel, leilões de madeira de valor e listagens de varejo aparecem como categorias individuais e nunca são misturados. Um lote de leilão premium não distorce a linha de base.
A divisão é o ponto principal: a FourA resolve o acesso à web, a KORENA resolve a madeira. Nenhuma delas se torna uma caixa preta da qual a outra dependa.
Por que a transparência nos preços da madeira é de repente urgente
Regulamentações europeias mais rígidas, incluindo o Regulamento de Desmatamento da UE (EUDR), estão pressionando o mercado de madeira em direção à rastreabilidade total e a uma documentação de origem mais limpa. A transparência de preços é a outra metade dessa equação. Produtores de madeira comparando valores regionais, compradores validando cotações e marketplaces digitais definindo taxas de referência precisam de dados diários, localizados e comparáveis. Não de médias anuais desatualizadas. Não de números locais pontuais.
Para uma equipe de engenharia enxuta de duas pessoas cobrir dez países e centenas de formatos web imprevisíveis, eles não podiam se dar ao luxo de gastar tempo gerenciando infraestrutura de proxy, frotas de navegadores e soluções alternativas anti-bot (consulte o custo oculto de manter seus próprios scrapers para ver o cálculo completo). A FourA cuida da camada de request. A KORENA recupera o tempo para focar na normalização de espécies, ajuste de OCR, lógica de precificação e trilhas de auditoria, o trabalho que só eles podem fazer.
Preços diários de madeira costumavam significar uma ligação telefônica para o seu corretor regional. Agora qualquer pessoa pode traçar a curva por conta própria em timber-index.korena.eu. Os próximos dez produtos semelhantes a índices não terão tempo para construir a camada de busca do zero. Essa é a aposta que estamos fazendo.
Construindo um produto com dados públicos da web e cansado de manter seus próprios scrapers e infraestrutura de proxy? Comece a usar a FourA.