全部文章

FourA Digest (2026年5月1日至5月8日)

Proxy Finder 现在根据对目标网站的实际有效性来选择 proxy,此外还包括 Browser 稳定性修复和 Dashboard 产品过滤器。

Highlights

Proxy Finder 实现了基于主机的学习。它不再只是选择一个通常速度较快的 proxy,而是选择一个已经对你正在访问的网站生效过的 proxy。Browser 获得了稳定性修复,解决了某一类冷启动失败问题。此外,Dashboard 的 Metrics 和 Activity 视图现在可以按产品进行筛选。

What's New

Proxy Finder 选择对目标实际有效的 proxy

这是本周最大的改动,经历了多次迭代才最终落地。

之前:Proxy Finder 根据整体健康状况从全局池中进行选择。对同一个目标网站的两个 request 会从同一个大池中选择,即使该池中的大多数 proxy 并不适用于该特定网站。

现在:对于你查询的每个目标主机,Proxy Finder 都会跟踪哪些 proxy 实际成功交付。新的 request 会从已验证的集合中抽样选择几个,并回退到对未知 proxy 的少量探测以持续学习,同时避开那些已经在该目标上失败过的 proxy。已验证的集合是基于每个主机的,并且在重启后依然保留。

如果你抓取受保护的网站,且其中只有极少比例的 proxy 能够工作,你应该能明显感受到这一变化。更少的无效选择,更少的重试,以及更少的预算浪费。

我们通过 feature flag 逐步推出了这一功能,进行了六次迭代以修复边缘问题(其中一次是为了限制学习逻辑,使其在低流量下保持稳定,又额外进行了两次调整),并在本周切换了生产环境的默认设置。

Browser 在空闲期后更加可靠

两次修复,一个结果。

第一,Browser 在冷启动时存在一个陈旧状态的 bug。在足够的空闲时间后,底层的显示层会持有一个锁,导致下一次启动无法成功。在一段安静期后,你的第一个 request 可能会失败或挂起。我们现在在启动前会清除该锁。

第二,在某些环境中,路由到 Browser 的公共 API 路径指向了错误的目的地。流量被静默地错误路由。现在路由配置已修正。

如果你在低流量下遇到过 Browser 首次 request 不稳定的情况,原因就在这里。

按产品过滤 Metrics 和 Activity

Dashboard 的 Metrics 和 Activity 页面现在新增了产品标签过滤器。点击 Single、Browser 或 Proxy Finder,图表将仅展示该产品的流量。当你只想查看某一部分使用情况的延迟或错误,而不是汇总视图时,这非常有用。

网站小幅更新

/jobs 页面已上线。我们正在招聘一名 Founding Engineer 和一名 Engineer。这两个页面都详细说明了工作范围、第一个月的工作规划以及如何申请。

我们还优化了首页 Dashboard 预览在移动端的渲染效果,更新了九个公共路由的单页社交分享图片,针对 2026 年 AI 时代更新了 robots.txt(允许检索和社交分享预览,拦截训练爬虫),并更新了 Terms of Service,加入了更清晰的合理使用条款以及包含欧盟消费者豁免条款的索非亚管辖权说明。

Under the Hood

在此期间进行了一项非面向客户的重命名:全站的 "anti-bot bypass" 变更为 "anti-bot resilience"。产品相同,行为一致;旧的表述触发了广告平台的政策过滤器。

我们目前还没有公布新选择逻辑的数据。我们希望在对成功率做出声明之前,先积累两周干净的生产环境流量。一旦有了真实数据,我们会立即公布。

在过去的一个月里,我们重构了决定对哪个目标使用哪个 proxy 的层。难点不在于算法,而在于衡量它在实际工作负载下是否真的有帮助。这就是 5 月的规划。