每个 proxy 服务商都在推销的数字
4 亿个 IP。1.55 亿。1 亿。随便挑一个住宅 proxy 提供商,你首先看到的就是其池规模。池子越大,产品越好。十年来,这一直是他们的卖点。
2026 年初,两件事打破了这一卖点。一是网络拆除行动。二是没有任何销售 proxy 的人愿意公布的基准测试。
今年 1 月,Google 的威胁情报小组(Threat Intelligence Group)瓦解了 IPIDEA。这是一个住宅 proxy 网络,在 550 多个不同的威胁主体中运行着 900 万至 1100 万个日活跃 IP(GreyNoise,2026 年 4 月)。这次拆除行动一夜之间使该网络的池规模缩减了大约 40%。如果池规模真的那么重要,这本该引起市场震动。但事实并非如此。几天之内,缺口就转移到了数据中心流量,其他网络吸收了这些需求(BleepingComputer,2026 年 4 月)。失去的容量迅速得到了重建。
这就是破绽所在。当你能抽走一个主要网络 40% 的供应,而下游没有任何变化时,说明供应从来都不是稀缺资源。
IP reputation 才是真正的产品。但它正在失效。
池规模一直只是另一种东西的代名词:信任。住宅 IP 属于真实家庭,因此 anti-bot 系统会将其视为真实用户。庞大的池规模意味着在任何单个 IP 被标记之前,有大量新鲜、受信任的 IP 可供轮换。你买的不是 IP。你买的是以百万为单位出售的 reputation。
这种信任正在崩溃。分析了 40 亿次会话的研究人员发现,住宅 proxy 在 78% 的情况下都能绕过 IP reputation 检测(BleepingComputer,2026 年 4 月)。反过来理解:如果恶意流量在 IP 层面上与合法流量完全相同,防御者就无法通过 IP 来区分它们。于是他们不再尝试这样做。
防御者已经开始行动了。IPinfo 和 AbuseIPDB 在 RSA 2026 上展示的研究表明,53% 的活跃滥用 IP 可追溯到 VPN 或住宅 proxy,其中 45% 特别指向住宅 proxy(Brander Group,2026 年 5 月)。当你的“滥用”列表有一半与普通家庭用户无法区分时,IP reputation 就不再是过滤器了。它只是噪音。
因此,令人尴尬的部分来了。你一直花高价购买的信号(干净、受信任的 IP),正是防御者正在默默弃用的信号。你买的是一堵正在被拆除的墙的准入权。
况且,池规模从来都不是一个诚实的数据
甚至在信任问题出现之前,宣传的数字就注水了。Proxyway 在 2026 年的测试中发现,一家服务商宣传拥有 1.55 亿个住宅 proxy,但其实际运行的池规模“大小一般,日常使用中远未达到这个数字”(Proxyway,2026 年)。Bright Data 宣传拥有超过 4 亿个。定价页面上的数字是历史累计出现过的总数,而不是在你发起 request 的那一瞬间处于活跃且可达的状态。
池规模之所以一直作为核心指标存在,原因与手机相机的像素一样:这是一个容易印在宣传册上、且买家几乎无法验证的庞大数字。而且它完全无法告诉你,你向特定目标发起的特定 request 是否真的能成功通过。
真正能预测成功率的是什么
Proxy 类型仍然重要,只是不像广告横幅上宣传的那样。在受到严密保护的目标上,数据中心 IP 的被封禁率达到 30% 到 60%,而住宅 IP 的成功率则在 85% 到 99% 之间(SparkProxy,2026 年)。在目标进行反击时,住宅 IP 胜出。但关于池规模的宣传忽略了另一半事实:在没有强力 bot detection 的网站上,数据中心 proxy 的通过率超过 85% 到 90%(Torch Proxies,2026 年 2 月),而成本仅为前者的一小部分。
大多数目标并没有那么强的对抗性。我们曾看到一些团队在那些用数据中心池就能轻松搞定的网站上,把整月的预算都烧在了住宅 IP 上。proxy 类型应该匹配目标的防御机制,而不是服务商的营销文案。
而且 proxy 只是其中一层。指出 IP reputation 失效的同一批研究人员,正引导防御者转向行为信号:来自轮换 IP 的顺序探测、在 IP 变更后依然存在的设备指纹、以及不像人类行为的 request 耗时(SC Media,2026 年 4 月)。我们在 Bot Detection Went Behavioral 中深入探讨了这一转变。一个干净的住宅 IP,如果包裹着一个行为像脚本的 request,依然会被拦截。
这对数据团队意味着什么
停止为池规模买单。它无法为你提供任何有实际指导意义的信息。
相反,应该针对你自己的目标来衡量成功率。在你想实际抓取的网站上,通过数据中心和住宅 IP 运行相同的任务,并对比首次 request 成功率以及每次成功 response 的成本。对许多团队来说,结果可能会有些扎心:便宜的方案能搞定大部分列表,而昂贵的池子只在少数具有强对抗性的域名上才物有所值。(顺便提一句,这也是自行维护爬虫的隐藏成本的很大一部分来源。)
然后,将节省下来的预算花在能真正提升指标的地方:在指纹和行为层面上让 request 看起来像真实的客户端,并将每个目标路由到适合它的 proxy 类型。这是针对每个目标(per-target)的决策,而不是针对每个服务商(per-vendor)的决策。如果一个 request 携带的机器人指纹与前 10,000 个完全相同,那么全球最大的池子也救不了它。
取代池规模的问题
proxy 行业花了十年时间去竞争一个悄然失去预测结果作用的数字。IP reputation 正在经历与 User-Agent 字符串相同的轨迹:曾经是主要信号,现在几乎不值一提。本该导致供应短缺的拆除行动,最终只换来了一次耸肩,这一个事件就说明了全部问题。
拥有九位数 IP 宣传横幅的服务商会继续印下去,因为横幅依然能卖出去。但在 2026 年获胜的团队不再询问“你们的池子有多大”,而是开始询问“我们的 request 成功通过的频率是多少,成本是多少”。这是完全不同的问题,而且其中只有一个问题能给出可以放在仪表盘上的答案。这也是我们围绕将 proxy 与你的目标进行匹配来构建 Proxy Finder,而不是吹嘘宣传数据的原因。