为什么 Proxy 池规模在 2026 年不再重要

每个 proxy 服务商都在推销的数字

4 亿个 IP。1.55 亿。1 亿。随便挑一个住宅 proxy 提供商，你首先看到的就是其池规模。池子越大，产品越好。十年来，这一直是他们的卖点。

2026 年初，两件事打破了这一卖点。一是网络拆除行动。二是没有任何销售 proxy 的人愿意公布的基准测试。

今年 1 月，Google 的威胁情报小组（Threat Intelligence Group）瓦解了 IPIDEA。这是一个住宅 proxy 网络，在 550 多个不同的威胁主体中运行着 900 万至 1100 万个日活跃 IP（GreyNoise，2026 年 4 月）。这次拆除行动一夜之间使该网络的池规模缩减了大约 40%。如果池规模真的那么重要，这本该引起市场震动。但事实并非如此。几天之内，缺口就转移到了数据中心流量，其他网络吸收了这些需求（BleepingComputer，2026 年 4 月）。失去的容量迅速得到了重建。

这就是破绽所在。当你能抽走一个主要网络 40% 的供应，而下游没有任何变化时，说明供应从来都不是稀缺资源。

IP reputation 才是真正的产品。但它正在失效。

池规模一直只是另一种东西的代名词：信任。住宅 IP 属于真实家庭，因此 anti-bot 系统会将其视为真实用户。庞大的池规模意味着在任何单个 IP 被标记之前，有大量新鲜、受信任的 IP 可供轮换。你买的不是 IP。你买的是以百万为单位出售的 reputation。

这种信任正在崩溃。分析了 40 亿次会话的研究人员发现，住宅 proxy 在 78% 的情况下都能绕过 IP reputation 检测（BleepingComputer，2026 年 4 月）。反过来理解：如果恶意流量在 IP 层面上与合法流量完全相同，防御者就无法通过 IP 来区分它们。于是他们不再尝试这样做。

防御者已经开始行动了。IPinfo 和 AbuseIPDB 在 RSA 2026 上展示的研究表明，53% 的活跃滥用 IP 可追溯到 VPN 或住宅 proxy，其中 45% 特别指向住宅 proxy（Brander Group，2026 年 5 月）。当你的“滥用”列表有一半与普通家庭用户无法区分时，IP reputation 就不再是过滤器了。它只是噪音。

因此，令人尴尬的部分来了。你一直花高价购买的信号（干净、受信任的 IP），正是防御者正在默默弃用的信号。你买的是一堵正在被拆除的墙的准入权。

况且，池规模从来都不是一个诚实的数据

甚至在信任问题出现之前，宣传的数字就注水了。Proxyway 在 2026 年的测试中发现，一家服务商宣传拥有 1.55 亿个住宅 proxy，但其实际运行的池规模“大小一般，日常使用中远未达到这个数字”（Proxyway，2026 年）。Bright Data 宣传拥有超过 4 亿个。定价页面上的数字是历史累计出现过的总数，而不是在你发起 request 的那一瞬间处于活跃且可达的状态。

池规模之所以一直作为核心指标存在，原因与手机相机的像素一样：这是一个容易印在宣传册上、且买家几乎无法验证的庞大数字。而且它完全无法告诉你，你向特定目标发起的特定 request 是否真的能成功通过。

真正能预测成功率的是什么

Proxy 类型仍然重要，只是不像广告横幅上宣传的那样。在受到严密保护的目标上，数据中心 IP 的被封禁率达到 30% 到 60%，而住宅 IP 的成功率则在 85% 到 99% 之间（SparkProxy，2026 年）。在目标进行反击时，住宅 IP 胜出。但关于池规模的宣传忽略了另一半事实：在没有强力 bot detection 的网站上，数据中心 proxy 的通过率超过 85% 到 90%（Torch Proxies，2026 年 2 月），而成本仅为前者的一小部分。

大多数目标并没有那么强的对抗性。我们曾看到一些团队在那些用数据中心池就能轻松搞定的网站上，把整月的预算都烧在了住宅 IP 上。proxy 类型应该匹配目标的防御机制，而不是服务商的营销文案。

而且 proxy 只是其中一层。指出 IP reputation 失效的同一批研究人员，正引导防御者转向行为信号：来自轮换 IP 的顺序探测、在 IP 变更后依然存在的设备指纹、以及不像人类行为的 request 耗时（SC Media，2026 年 4 月）。我们在 Bot Detection Went Behavioral 中深入探讨了这一转变。一个干净的住宅 IP，如果包裹着一个行为像脚本的 request，依然会被拦截。

这对数据团队意味着什么

停止为池规模买单。它无法为你提供任何有实际指导意义的信息。

相反，应该针对你自己的目标来衡量成功率。在你想实际抓取的网站上，通过数据中心和住宅 IP 运行相同的任务，并对比首次 request 成功率以及每次成功 response 的成本。对许多团队来说，结果可能会有些扎心：便宜的方案能搞定大部分列表，而昂贵的池子只在少数具有强对抗性的域名上才物有所值。（顺便提一句，这也是自行维护爬虫的隐藏成本的很大一部分来源。）

然后，将节省下来的预算花在能真正提升指标的地方：在指纹和行为层面上让 request 看起来像真实的客户端，并将每个目标路由到适合它的 proxy 类型。这是针对每个目标（per-target）的决策，而不是针对每个服务商（per-vendor）的决策。如果一个 request 携带的机器人指纹与前 10,000 个完全相同，那么全球最大的池子也救不了它。

取代池规模的问题

proxy 行业花了十年时间去竞争一个悄然失去预测结果作用的数字。IP reputation 正在经历与 User-Agent 字符串相同的轨迹：曾经是主要信号，现在几乎不值一提。本该导致供应短缺的拆除行动，最终只换来了一次耸肩，这一个事件就说明了全部问题。

拥有九位数 IP 宣传横幅的服务商会继续印下去，因为横幅依然能卖出去。但在 2026 年获胜的团队不再询问“你们的池子有多大”，而是开始询问“我们的 request 成功通过的频率是多少，成本是多少”。这是完全不同的问题，而且其中只有一个问题能给出可以放在仪表盘上的答案。这也是我们围绕将 proxy 与你的目标进行匹配来构建 Proxy Finder，而不是吹嘘宣传数据的原因。