Con số mà mọi nhà cung cấp proxy đều bán
400 triệu IP. 155 triệu. 100 triệu. Chọn bất kỳ nhà cung cấp residential proxy nào và điều đầu tiên bạn thấy sẽ là kích thước pool của họ. Pool càng lớn, sản phẩm càng tốt. Đó đã là lời chào hàng trong suốt một thập kỷ qua.
Hai sự kiện đã phá vỡ lời chào hàng đó vào đầu năm 2026. Một là một chiến dịch triệt phá. Hai là một kết quả đo lường hiệu năng (benchmark) mà không nhà bán proxy nào muốn công bố.
Vào tháng 1, Nhóm Tình báo Mối đe dọa của Google (Google's Threat Intelligence Group) đã triệt phá IPIDEA, một mạng lưới residential proxy vận hành từ 9 đến 11 triệu IP hoạt động hàng ngày trên hơn 550 tác nhân đe dọa khác nhau (GreyNoise, tháng 4 năm 2026). Chiến dịch triệt phá này đã cắt giảm khoảng 40% pool của mạng lưới chỉ sau một đêm. Nếu kích thước pool là yếu tố thực sự quan trọng, điều đó lẽ ra đã làm rung chuyển thị trường. Nhưng thực tế thì không. Chỉ trong vòng vài ngày, lượng thiếu hụt đã được chuyển dịch sang lưu lượng datacenter và các mạng lưới khác đã hấp thụ hết nhu cầu (BleepingComputer, tháng 4 năm 2026). Năng lực bị mất đã nhanh chóng được khôi phục.
Và đó chính là dấu hiệu rõ ràng nhất. Khi bạn có thể rút đi 40% nguồn cung của một mạng lưới lớn mà không có gì thay đổi ở phía hạ nguồn, nguồn cung chưa bao giờ là thứ khan hiếm.
IP reputation mới là sản phẩm thực sự. Và nó đang thất bại.
Kích thước pool luôn là một đại diện cho một thứ khác: sự tin cậy. Một IP residential thuộc về một hộ gia đình thực tế, vì vậy các hệ thống anti-bot coi nó như một người dùng thực. Một pool lớn đồng nghĩa với việc có nhiều IP mới, đáng tin cậy để xoay vòng trước khi bất kỳ IP đơn lẻ nào bị gắn cờ. Bạn không mua IP. Bạn đang mua danh tiếng (reputation), được bán theo đơn vị hàng triệu.
Sự tin cậy đó đang sụp đổ. Các nhà nghiên cứu phân tích 4 tỷ phiên truy cập nhận thấy residential proxy đã vượt qua các bước kiểm tra IP reputation trong 78% trường hợp (BleepingComputer, tháng 4 năm 2026). Hãy đọc ngược lại: nếu lưu lượng độc hại trông giống hệt lưu lượng hợp lệ ở cấp độ IP, bên phòng thủ không thể sử dụng IP để phân biệt chúng. Vì vậy, họ ngừng cố gắng làm điều đó.
Các bên phòng thủ đã bắt đầu hành động. IPinfo và AbuseIPDB đã trình bày nghiên cứu tại RSA 2026 cho thấy 53% các IP lạm dụng tích cực có nguồn gốc từ VPN hoặc residential proxy, và 45% cụ thể là từ residential proxy (Brander Group, tháng 5 năm 2026). Khi một nửa danh sách "lạm dụng" của bạn không thể phân biệt được với người dùng gia đình thông thường, IP reputation không còn là một bộ lọc nữa. Nó là nhiễu.
Vì vậy, đây là phần đáng ngại. Tín hiệu mà bạn đã phải trả mức giá cao để có được (một IP sạch, đáng tin cậy) lại chính là tín hiệu mà các bên phòng thủ đang âm thầm loại bỏ. Bạn đang mua quyền truy cập vào một bức tường đang bị dỡ bỏ.
Kích thước pool chưa bao giờ là một con số trung thực
Ngay cả trước khi vấn đề lòng tin xuất hiện, các con số trên tiêu đề quảng cáo đã không hề chắc chắn. Thử nghiệm năm 2026 của Proxyway đã phát hiện một nhà cung cấp quảng cáo 155 triệu residential proxy trong khi vận hành một pool có "kích thước trung bình và không hề gần với con số này trong sử dụng hàng ngày" (Proxyway, 2026). Bright Data quảng cáo hơn 400 triệu. Con số trên trang bảng giá là tổng số IP từng được ghi nhận, chứ không phải những gì đang hoạt động và có thể tiếp cận được ngay tại thời điểm bạn gửi một request.
Kích thước pool vẫn tồn tại như một chỉ số tiêu đề vì lý do tương tự như số megapixel trên camera điện thoại: đó là một con số lớn dễ in ấn và gần như không thể xác minh đối với người mua. Và nó không cho bạn biết bất cứ điều gì về việc liệu request cụ thể của bạn gửi đến mục tiêu cụ thể có thực sự thành công hay không.
Điều gì thực sự dự báo thành công
Loại proxy vẫn quan trọng, chỉ là không theo cách mà các banner quảng cáo gợi ý. Các IP datacenter bị chặn từ 30 đến 60% thời gian trên các mục tiêu được bảo vệ nghiêm ngặt, trong khi residential đạt tỷ lệ thành công từ 85 đến 99% (SparkProxy, 2026). Residential chiến thắng ở những nơi mục tiêu có sự phản kháng. Nhưng lời chào hàng về kích thước pool đã bỏ qua nửa còn lại: trên các trang web không có hệ thống phát hiện bot nghiêm ngặt, datacenter proxy vượt qua hơn 85 đến 90% (Torch Proxies, tháng 2 năm 2026), với chi phí chỉ bằng một phần nhỏ.
Hầu hết các mục tiêu không hề thù địch. Chúng tôi đã chứng kiến nhiều đội ngũ đốt toàn bộ ngân sách của một tháng vào các IP residential cho những trang web mà một pool datacenter hoàn toàn có thể xử lý tốt. Loại proxy nên phù hợp với hệ thống phòng thủ của mục tiêu, chứ không phải nội dung marketing của nhà cung cấp.
Và proxy chỉ là một lớp. Chính các nhà nghiên cứu đã cảnh báo về sự sụp đổ của IP reputation cũng hướng các bên phòng thủ sang các tín hiệu hành vi (behavioral signals) thay thế: dò quét tuần tự từ các IP xoay vòng, device fingerprint tồn tại qua các lần thay đổi IP, thời gian gửi request không di chuyển giống như con người (SC Media, tháng 4 năm 2026). Chúng tôi đã đi sâu vào sự chuyển dịch đó trong bài viết Bot Detection Went Behavioral. Một IP residential nguyên bản bọc quanh một request có hành vi giống như một script thì dù thế nào cũng sẽ bị phát hiện.
Điều này có ý nghĩa gì đối với các đội ngũ dữ liệu
Hãy ngừng tìm kiếm dựa trên kích thước pool. Nó không cung cấp cho bạn thông tin nào có thể hành động được.
Thay vào đó, hãy đo lường tỷ lệ thành công trên chính các mục tiêu của bạn. Chạy cùng một tác vụ qua các IP datacenter và residential, trên các trang web bạn thực sự scrape, rồi so sánh tỷ lệ thành công của request đầu tiên và chi phí cho mỗi response thành công. Đối với nhiều đội ngũ, kết quả có thể hơi đau lòng: tùy chọn giá rẻ xử lý được hầu hết danh sách, và pool đắt đỏ chỉ thực sự phát huy giá trị trên một số ít tên miền thù địch. (Nhân tiện, đó cũng là nơi ẩn chứa một phần lớn chi phí ẩn của việc tự vận hành scraper.)
Sau đó, hãy đầu tư ngân sách tiết kiệm được vào nơi thực sự thay đổi các con số: làm cho các request trông giống như một client thực ở lớp fingerprint và hành vi, đồng thời định tuyến từng mục tiêu qua loại proxy phù hợp với nó. Đó là một quyết định dựa trên từng mục tiêu, chứ không phải dựa trên từng nhà cung cấp. Pool lớn nhất trên hành tinh cũng không thể cứu vãn một request mang cùng một fingerprint tự động như 10.000 request trước đó.
Câu hỏi thay thế cho kích thước pool
Ngành công nghiệp proxy đã dành một thập kỷ để chạy đua theo một con số mà giờ đây đã âm thầm ngừng dự báo kết quả. IP reputation đang đi theo đúng quỹ đạo mà chuỗi User-Agent đã đi qua: từng là tín hiệu chính, giờ đây hầu như chỉ là một phần phụ chú. Chiến dịch triệt phá lẽ ra phải gây ra tình trạng khan hiếm thì thay vào đó lại chỉ nhận được một cái nhún vai, và đó là toàn bộ câu chuyện được gói gọn trong một sự kiện.
Các nhà cung cấp với các banner quảng cáo IP có chín chữ số sẽ tiếp tục in chúng, bởi vì các banner đó vẫn bán được hàng. Nhưng các đội ngũ chiến thắng vào năm 2026 đã ngừng hỏi "pool của bạn lớn cỡ nào" và bắt đầu hỏi "tần suất request của tôi thành công là bao nhiêu, và chi phí là bao nhiêu." Đó là những câu hỏi khác nhau, và chỉ một trong số chúng có câu trả lời mà bạn có thể đưa lên dashboard. Đó là lý do tại sao chúng tôi xây dựng Proxy Finder xoay quanh việc khớp proxy với mục tiêu của bạn thay vì khoe khoang về số lượng trên tiêu đề.