التعامل مع حماية مكافحة البوتات
تستخدم المواقع الإلكترونية الحديثة أنظمة متقدمة للكشف عن البوتات. يوضح هذا الدليل كيف يتعامل FourA مع أنظمة مكافحة البوتات وكيفية زيادة معدل نجاحك إلى الحد الأقصى.
كيف يعمل الكشف عن البوتات
تستخدم المواقع الإلكترونية عدة طبقات من الحماية:
- سمعة الـ IP: يتم حظر مراكز البيانات وعناوين proxy المعروفة
- بصمة الاتصال (Wire fingerprinting): يمتلك كل عميل HTTP توقيع مصافحة (handshake) فريدًا يمكن للمواقع اكتشافه
- بصمة المتصفح (Browser fingerprinting): تتحقق لغة JavaScript من مؤشرات المتصفحات من نوع headless
- التحليل السلوكي: أنماط الـ request، والتوقيت، ومسار التنقل
- CAPTCHAs: التحديات المرئية كخط دفاع أخير
تشمل الجهات المزودة لخدمات مكافحة البوتات الشائعة كلاً من Cloudflare و DataDome و PerimeterX و Akamai Bot Manager.
كيف يساعد FourA
طلبات واقعية على مستوى الاتصال (Wire-Level)
يرسل الـ endpoint الفردي (POST /api/single/) خصائص مصافحة (handshake) تطابق متصفحًا حقيقيًا. يتجاوز هذا عمليات التحقق الأكثر شيوعًا على مستوى الاتصال (wire-level) دون أعباء تشغيل متصفح كامل.
قم بتمكين unblocker لحقن الـ headers الواقعية للمتصفح أيضًا (User-Agent، و Sec-Ch-Ua، و Sec-Fetch-*، و Accept-Encoding):
{
"method": "GET",
"url": "https://protected-site.com/data",
"unblocker": true
}
عرض المتصفح الحقيقي
يقوم الـ endpoint الخاص بالمتصفح (POST /api/browser/) بتشغيل مثيل متصفح Chrome كامل. وبالاقتران مع رقع مكافحة الكشف، فإنه يتجاوز معظم عمليات التحقق من البصمات المستندة إلى JavaScript.
تدوير الـ Proxy
يقوم الـ endpoint الخاص بالـ proxy (POST /api/proxy/) بتدوير الـ proxies السكنية ومراكز البيانات تلقائيًا. إذا تم حظر عنوان IP واحد، فإن المحاولة التالية تستخدم عنوانًا مختلفًا.
الإستراتيجية حسب مستوى الحماية
حماية منخفضة (معظم المواقع)
استخدم الـ endpoint الفردي مع unblocker. فالمطابقة على مستوى الاتصال (wire-level) كافية.
curl -X POST https://eu.api.foura.ai/api/single/ \
-H "X-API-Key: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{"method": "GET", "url": "https://news-site.com/article", "unblocker": true}'
حماية متوسطة (Cloudflare، و WAF أساسي)
استخدم الـ endpoint الخاص بالمتصفح لتجاوز تحديات JavaScript:
curl -X POST https://eu.api.foura.ai/api/browser/ \
-H "X-API-Key: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{"url": "https://protected-site.com/data", "timeout_ms": 15000}'
حماية عالية (DataDome، و PerimeterX)
استخدم الـ endpoint الخاص بالـ proxy مع محاولات إعادة متعددة:
curl -X POST https://eu.api.foura.ai/api/proxy/ \
-H "X-API-Key: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"maxTries": 10,
"request": {
"method": "GET",
"url": "https://heavily-protected.com/prices",
"unblocker": true
}
}'
بالنسبة لسلاسل WAF من الفئة الأولى (Vercel Security Checkpoint، و Cloudflare "Just a moment"، و Akamai Bot Manager) حيث تحتاج إلى الصفحة المعروضة بعد تجاوز التحدي، راجع وصفة تحدي WAF لنمط الـ proxy المتسلسل ← المتصفح.
أفضل الممارسات
ابدأ ببساطة، وصعّد تدريجيًا. جرب الـ endpoint الفردي أولاً. لا تنتقل إلى المتصفح أو الـ proxy إلا عند الحاجة.
احترم الـ rate limits. حتى مع تدوير الـ proxy، فإن إرسال مئات الـ requests في الثانية إلى موقع واحد سيؤدي إلى تفعيل الكشف السلوكي. باعد بين الـ requests الخاصة بك بمقدار 1 إلى 2 ثانية على الأقل.
استخدم
unblocker. بالنسبة لطلبات الـ single والـ proxy، قم بتمكينunblockerلحقن الـ headers الواقعية للمتصفح تلقائيًا بدلاً من تعيين سلاسل User-Agent يدويًا.راقب معدلات النجاح. تحقق من مقاييس Dashboard لتتبع معدل نجاحك بمرور الوقت. عادةً ما يعني الانخفاض المفاجئ أن الموقع المستهدف قد حدّث حمايته.
قم بزيادة
maxTriesللأهداف الصعبة. يبلغ الإعداد الافتراضي للـ endpoint الخاص بالـ proxy 5 محاولات، ولكن يمكنك تعيين ما يصل إلى 90 محاولة للمواقع ذات الحماية الشديدة.
ما لا يمكن لـ FourA تجاوزه
تتطلب بعض السيناريوهات معالجة إضافية خارج الـ API:
- المحتوى المحمي بتسجيل الدخول: لا يدير FourA الجلسات أو الـ cookies عبر الـ requests (يدعم الـ endpoint الخاص بالمتصفح تعيين الـ cookies لكل request)
- تحديات CAPTCHAs التفاعلية: تتطلب خدمات reCAPTCHA v3 و hCaptcha خدمات حل خارجية
- القوائم البيضاء للدول / ASN: لا تقبل المواقع المرخصة محليًا (مواقع المراهنات عبر الإنترنت، وبعض الخدمات الحكومية) حركة المرور إلا من مجموعة صغيرة من مزودي خدمة الإنترنت (ISPs). لن يساعد تدوير الـ proxy في هذه الحالة؛ ستحتاج إلى مصدر بيانات مختلف.
- المواقع ذات القيود القانونية: تأكد دائمًا من أن جمع البيانات الخاص بك يتوافق مع شروط خدمة الموقع المستهدف والقوانين المعمول بها
الخطوات التالية
- اختيار الـ Endpoint المناسب: دليل اتخاذ القرار للـ endpoints
- المشكلات الشائعة: إصلاح أخطاء 403 وحظر الكابتشا
- API Endpoints: مرجع المعلمات الكامل
- وصفات MCP: قوالب سير العمل بما في ذلك سلسلة تحدي WAF