Chọn Endpoint Phù Hợp
FourA cung cấp ba API endpoint, mỗi endpoint được tối ưu hóa cho các tình huống khác nhau. Việc chọn đúng endpoint giúp tiết kiệm thời gian, giảm chi phí và cải thiện tỷ lệ thành công.
Hướng dẫn Quyết định Nhanh
Sử dụng single endpoint khi:
- Trang mục tiêu được dựng phía máy chủ (server-rendered, không yêu cầu JavaScript)
- Bạn cần tốc độ tối đa (thường dưới 1 giây)
- Bạn đang thu thập dữ liệu từ các API hoặc trang HTML tĩnh
Sử dụng browser endpoint khi:
- Trang phụ thuộc vào JavaScript để hiển thị nội dung
- Nội dung tải động sau khi tải trang ban đầu
- Bạn cần DOM được dựng hoàn chỉnh
Sử dụng proxy endpoint khi:
- Trang web mục tiêu chủ động chặn các request
- Bạn cần xoay vòng qua nhiều địa chỉ IP
- Các lần thử trước đó trả về trang lỗi 403 hoặc CAPTCHA
So sánh các Endpoint
Single (POST /api/single/)
Tùy chọn nhanh nhất. Gửi một HTTP request với các đặc tính truyền tải thực tế giống như trình duyệt, mà không cần khởi chạy một tiến trình trình duyệt.
curl -X POST https://eu.api.foura.ai/api/single/ \
-H "X-API-Key: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{"method": "GET", "url": "https://example.com/api/products", "unblocker": true}'
Thời gian phản hồi thông thường: 200ms đến 2s Tốt nhất cho: API, trang tin tức, blog, trang sản phẩm tĩnh
Browser (POST /api/browser/)
Mở URL của bạn trong một phiên bản trình duyệt Chrome. Trang sẽ tải hoàn toàn, JavaScript được thực thi và bạn nhận được mã HTML đã dựng hoàn chỉnh.
curl -X POST https://eu.api.foura.ai/api/browser/ \
-H "X-API-Key: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"url": "https://example.com/spa-app",
"timeout_ms": 15000,
"checkText": "data-table"
}'
Thời gian phản hồi thông thường: 2s đến 10s Tốt nhất cho: Ứng dụng đơn trang (SPA), trang web có tính năng lazy loading, nội dung được dựng bằng JavaScript
Proxy (POST /api/proxy/)
Kết hợp các HTTP request với tính năng tự động xoay vòng proxy. Nếu lần thử đầu tiên thất bại hoặc bị chặn, FourA sẽ thử lại qua các proxy khác.
curl -X POST https://eu.api.foura.ai/api/proxy/ \
-H "X-API-Key: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"maxTries": 5,
"request": {
"method": "GET",
"url": "https://example.com/pricing",
"unblocker": true
}
}'
Thời gian phản hồi thông thường: 1s đến 5s Tốt nhất cho: Theo dõi giá thương mại điện tử, tổng hợp dữ liệu du lịch, các trang web có hệ thống phát hiện bot
Khi nào nên Kết hợp các Phương pháp
Một số quy trình làm việc sẽ đạt hiệu quả cao hơn khi sử dụng kết hợp nhiều endpoint:
- Bắt đầu với single: kiểm tra xem trang có trả về dữ liệu hữu ích mà không cần trình duyệt hay không.
- Chuyển sang browser: nếu phản hồi trống hoặc thiếu nội dung, hãy chuyển sang chế độ dựng hình bằng trình duyệt.
- Thêm proxy: nếu bạn bị chặn (403/CAPTCHA), hãy bọc request của bạn trong proxy endpoint để tự động xoay vòng IP.
Cách tiếp cận lũy tiến này giúp giữ chi phí ở mức thấp trong khi tối đa hóa tỷ lệ thành công.
Mẹo Tối ưu Hiệu năng
- Sử dụng single endpoint theo mặc định và chỉ nâng cấp khi cần thiết
- Thiết lập
checkTexttrong các request browser để tránh phải chờ đợi các nội dung không cần thiết - Thiết lập
maxTriestrong các request proxy để kiểm soát hành vi thử lại (mặc định là 5, tối đa là 90) - Giữ các giá trị
timeout_msở mức hợp lý: từ 10 đến 15 giây cho hầu hết các trang
Các bước Tiếp theo
- API Endpoints: Tài liệu tham khảo đầy đủ về tham số
- Scrape a Dynamic Website: Hướng dẫn từng bước gửi request bằng browser
- Quick Start: Request đầu tiên của bạn trong 30 giây