Tất cả bài viết

Phát hiện vi phạm MAP trên sáu sàn thương mại điện tử

Giám sát MAP thủ công phát hiện vi phạm quá trễ sau nhiều ngày. Dưới đây là cách các đội ngũ bảo vệ thương hiệu scrape Amazon, Walmart, eBay và TikTok Shop trong thời gian cận thực tế.

Thách thức

Bạn quản lý một thương hiệu tiêu dùng. Chính sách đại lý của bạn quy định không ai được bán sản phẩm chủ lực dưới mức $179. Sau đó, một khách hàng gửi email: ai đó trên Amazon đã niêm yết sản phẩm với giá $144 vào cuối tuần trước. Đến khi bạn kiểm tra, danh sách sản phẩm đã biến mất. Người bán đã niêm yết lại với mức giá đúng ngay khi họ đạt được tốc độ bán hàng mục tiêu. Thiệt hại đã xảy ra, và bạn vẫn còn Walmart, eBay, TikTok Shop và Google Shopping để kiểm tra.

Đây là nhịp điệu của việc thực thi MAP vào năm 2026. Chỉ riêng hàng giả và hàng nhái đã đạt mức 467 tỷ USD trên toàn cầu (dữ liệu từ OECD và EUIPO, thông qua Red Points), và đó là chưa kể đến hoạt động kinh doanh chênh lệch giá ở thị trường xám và các vi phạm chính sách đại lý. Các sàn thương mại điện tử không kiểm soát giá thay cho bạn. Và 79% số vụ thu giữ hàng giả hiện nay đến từ các lô hàng bưu kiện nhỏ, nghĩa là những người bán hàng cá nhân lách qua hải quan trên quy mô lớn.

Những thương hiệu phát hiện nhanh chóng không phải nhờ chạy các bảng tính tốt hơn. Họ đang vận hành cơ sở hạ tầng giám sát truy cập vào mọi trang sản phẩm trên mọi sàn thương mại điện tử, mỗi giờ, tại mọi khu vực mà họ kinh doanh.

Cách tiếp cận của FourA

Thiết lập đơn giản nhất là một scraper cho mỗi sàn thương mại điện tử, một cron job, một cảnh báo. Sau đó, scraper của bạn bị lỗi vì Amazon thay đổi giao diện, các IP của bạn bị chặn vì bạn truy cập liên tục vào cùng một sản phẩm từ một ASN, hoặc quá trình trích xuất giá âm thầm trả về giá MSRP gạch ngang thay vì giá ưu đãi thực tế.

Một pipeline hoạt động hiệu quả gồm có bốn phần.

Discovery. Bắt đầu với danh sách SKU của bạn và tìm mọi ưu đãi đang hoạt động trên các sàn thương mại điện tử. Amazon ASIN, Walmart item ID, eBay listing ID, TikTok Shop product URL. Đây chủ yếu là hoạt động scraping danh mục: truy cập các trang danh mục, trang kết quả tìm kiếm và các biến thể PDP.

Page collection. Đối với mỗi ưu đãi, hãy tải trang trực tiếp và lấy giá hiển thị, tên người bán, chủ sở hữu buy box, bất kỳ coupon hoặc mức giảm giá Subscribe & Save nào, cùng với timestamp. Một số sàn thương mại điện tử cung cấp HTML sạch. TikTok Shop và Google Shopping render hầu hết logic giá bằng JavaScript, vì vậy bạn cần một trình duyệt thực sự, chứ không phải một thư viện request.

Price reconstruction. Đây là nơi hầu hết các đội ngũ gặp thất bại. Amazon hiển thị giá niêm yết, mức giảm giá Subscribe & Save từ 5-15%, đôi khi là coupon, đôi khi là chia nhỏ gói sản phẩm (multi-pack split). Mức giá thực tế mà khách hàng thanh toán hiếm khi là con số hiển thị ở tiêu đề. Một hệ thống giám sát chỉ gắn cờ giá tiêu đề sẽ bỏ lỡ các vi phạm ẩn trong các lớp giảm giá chồng lên nhau.

Evidence and alerts. Khi bạn gắn cờ một vi phạm, đội ngũ thực thi của bạn cần bằng chứng: URL, ảnh chụp màn hình (screenshot), giá chính xác, timestamp, người bán và thời gian tồn tại của ưu đãi. Không có những thông tin đó, quy trình giải quyết tranh chấp trên sàn thương mại điện tử sẽ không đi đến đâu.

Một nền tảng như FourA cung cấp cho bạn một API duy nhất cho các phần phức tạp. Các HTTP request cho các sàn thương mại điện tử cung cấp HTML sạch, các phiên trình duyệt (browser session) cho các sàn sử dụng nhiều JavaScript, và định tuyến proxy mà bạn không cần phải tự quản lý. Bạn hướng một request đến một Amazon product URL với cờ unblocker được thiết lập, và các header tương đương Chrome sẽ được gửi đi để trang được render một cách sạch sẽ. Bạn hướng một request đến Amazon US thông qua một proxy khu vực US, sau đó hướng cùng một SKU đó đến Amazon DE thông qua một proxy khu vực DE, và giá cả sẽ được trả về theo ngữ cảnh địa phương.

curl -X POST "https://api.foura.ai/api/proxy" \
  -H "x-api-key: YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "maxTries": 5,
    "timeout_ms": 30000,
    "request": {
      "method": "GET",
      "url": "https://www.amazon.com/dp/B0EXAMPLE",
      "unblocker": true,
      "validate": {
        "status": { "accept": [200] },
        "data": { "fail": ["captcha", "Robot Check"] }
      }
    }
  }'

Đó là toàn bộ lệnh gọi. Không có logic xoay vòng proxy (proxy rotation) trong mã nguồn của bạn. Không có bước kiểm tra "liệu trang web này hôm nay có chạy JavaScript không". Cơ sở hạ tầng xử lý việc định tuyến và thử lại (retry); pipeline của bạn xử lý logic giá. Để tìm hiểu sâu hơn về những gì cờ unblocker thực sự thực hiện trên đường truyền, hãy xem bài phân tích về Web Unblocker của chúng tôi.

Yếu tố địa lý quan trọng hơn mọi người nghĩ. Một thương hiệu bán hàng vào thị trường US, EU và UK cần khả năng hiển thị giá từ không gian IP của từng khu vực, bởi vì các sàn thương mại điện tử đôi khi cung cấp mức giá theo khu vực hoặc ẩn hoàn toàn ưu đãi đối với các IP ngoài khu vực. Định tuyến theo từng khu vực (per-region routing) nghĩa là bạn có thể xác minh xem một người bán quảng cáo "giao hàng toàn cầu" có thực sự vi phạm MAP tại các thị trường quan trọng hay không.

Kết quả

Một thương hiệu quy mô trung bình với 500 SKU, sáu sàn thương mại điện tử và ba khu vực sẽ có khoảng 9.000 trang sản phẩm cần giám sát. Tần suất giám sát hàng giờ tương đương khoảng 216.000 request mỗi ngày (kịch bản minh họa dựa trên phạm vi bảo vệ thương hiệu quy mô trung bình điển hình). Con số đó không là gì đối với một API được thiết kế chuyên biệt cho việc này, nhưng sẽ cần cả một đội ngũ kỹ sư làm việc toàn thời gian nếu bạn tự xây dựng hệ thống. Tuy nhiên, con số thú vị không phải là số lượng request mỗi ngày; mà là tần suất một vi phạm xuất hiện trực tuyến và bị phát hiện ngay trong cùng một giờ.

Trong thực tế, hiệu quả cải thiện sẽ có dạng như sau:

  • Độ trễ phát hiện (detection latency) giảm từ vài ngày (scrape thủ công hoặc hàng tuần) xuống dưới một giờ với cơ chế polling hàng giờ
  • Phạm vi bao phủ (coverage) chuyển từ "ba sàn thương mại điện tử mà tôi có thể theo kịp" sang toàn bộ sáu sàn mà thương hiệu thực sự đang kinh doanh
  • Tỷ lệ báo động giả (false positives) giảm mạnh khi quy trình price reconstruction xử lý chính xác các coupon, S&S và multi-pack
  • Chất lượng bằng chứng được nâng cao khi mỗi lượt phát hiện đi kèm với một screenshot và timestamp được gắn chặt với request

Nếu bạn đã đọc bài phân tích về việc tổng hợp danh sách bất động sản ở quy mô lớn của chúng tôi, mô hình này cũng tương tự: rất nhiều trang, render hỗn hợp, sự khác biệt về địa lý. Sản phẩm thay đổi; nhưng cấu trúc cơ sở hạ tầng thì không.

Kết luận chính

Vi phạm MAP không phải là vấn đề về chất lượng dữ liệu. Đó là vấn đề về thời gian. Ai nhìn thấy vi phạm trước sẽ có lợi thế: thương hiệu phát hiện ra trước khi danh sách sản phẩm chuyển đổi thành đơn hàng, hoặc đại lý bỏ túi biên lợi nhuận và thay đổi giá trước khi có ai đó kịp nhận ra. Mỗi lớp mà stack giám sát của bạn bổ sung (độ chính xác về địa lý, render JavaScript, tái cấu trúc lớp giá - price-stack reconstruction) thực chất chỉ là để giành lại từng phút từ chiếc đồng hồ đó.

Các thương hiệu chiến thắng trong cuộc chiến này vào năm 2026 đã ngừng coi việc thực thi MAP như một cuộc kiểm toán hàng quý. Họ bắt đầu coi nó như một cơ sở hạ tầng hoạt động trực tiếp. Vi phạm có chi phí khắc phục rẻ nhất là vi phạm được phát hiện ngay trong cùng một giờ mà nó xuất hiện.