올바른 Endpoint 선택
FourA는 각각 다른 시나리오에 최적화된 세 가지 API endpoint를 제공합니다. 올바른 endpoint를 선택하면 시간을 절약하고 비용을 줄이며 성공률을 높일 수 있습니다.
빠른 결정 가이드
다음과 같은 경우 single endpoint를 사용하세요:
- 대상 페이지가 서버 사이드 렌더링되는 경우 (JavaScript 불필요)
- 최대 속도가 필요한 경우 (일반적으로 1초 미만)
- API 또는 정적 HTML 페이지에서 데이터를 수집하는 경우
다음과 같은 경우 browser endpoint를 사용하세요:
- 페이지가 콘텐츠를 렌더링하기 위해 JavaScript에 의존하는 경우
- 초기 페이지 로드 후 콘텐츠가 동적으로 로드되는 경우
- 완전히 렌더링된 DOM이 필요한 경우
다음과 같은 경우 proxy endpoint를 사용하세요:
- 대상 사이트가 request를 적극적으로 차단하는 경우
- 여러 IP 주소를 교대로 회전해야 하는 경우
- 이전 시도에서 403 또는 CAPTCHA 페이지가 반환된 경우
Endpoint 비교
Single (POST /api/single/)
가장 빠른 옵션입니다. 브라우저 프로세스를 실행하지 않고, 실제 브라우저와 유사한 네트워크 특성을 가진 HTTP request를 보냅니다.
curl -X POST https://eu.api.foura.ai/api/single/ \
-H "X-API-Key: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{"method": "GET", "url": "https://example.com/api/products", "unblocker": true}'
일반적인 response 시간: 200ms ~ 2s 적합한 대상: API, 뉴스 사이트, 블로그, 정적 제품 페이지
Browser (POST /api/browser/)
Chrome 브라우저 인스턴스에서 URL을 엽니다. 페이지가 완전히 로드되고 JavaScript가 실행되며, 최종 렌더링된 HTML을 받게 됩니다.
curl -X POST https://eu.api.foura.ai/api/browser/ \
-H "X-API-Key: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"url": "https://example.com/spa-app",
"timeout_ms": 15000,
"checkText": "data-table"
}'
일반적인 response 시간: 2s ~ 10s 적합한 대상: 싱글 페이지 애플리케이션(SPA), 지연 로딩(lazy loading)을 사용하는 사이트, JavaScript로 렌더링되는 콘텐츠
Proxy (POST /api/proxy/)
HTTP request와 자동 proxy 회전을 결합합니다. 첫 번째 시도가 실패하거나 차단되면, FourA가 다른 proxy를 통해 재시도합니다.
curl -X POST https://eu.api.foura.ai/api/proxy/ \
-H "X-API-Key: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"maxTries": 5,
"request": {
"method": "GET",
"url": "https://example.com/pricing",
"unblocker": true
}
}'
일반적인 response 시간: 1s ~ 5s 적합한 대상: 이커머스 가격 모니터링, 여행 정보 애그리게이션, 봇 감지 기능이 있는 사이트
접근 방식을 결합해야 하는 경우
일부 워크플로우는 여러 endpoint를 함께 사용할 때 유리합니다.
- single로 시작: 브라우저 없이 페이지가 유용한 데이터를 반환하는지 테스트합니다.
- browser로 대체: response가 비어 있거나 콘텐츠가 누락된 경우, 브라우저 렌더링으로 전환합니다.
- proxy 추가: 차단(403/CAPTCHA)되는 경우, 자동 IP 회전을 위해 request를 proxy endpoint로 감쌉니다.
이러한 단계적 접근 방식은 비용을 낮게 유지하면서 성공률을 극대화합니다.
성능 팁
- 기본적으로 single endpoint를 사용하고 필요한 경우에만 업그레이드하세요
- 불필요한 콘텐츠를 기다리지 않도록 browser request에서
checkText를 설정하세요 - proxy request에서
maxTries를 설정하여 재시도 동작을 제어하세요 (기본값은 5, 최대값은 90) timeout_ms값을 적절하게 유지하세요: 대부분의 페이지에서 10~15초가 적당합니다
다음 단계
- API Endpoints: 전체 파라미터 참조
- 동적 웹사이트 스크래핑: 단계별 browser request 가이드
- 빠른 시작: 30초 만에 첫 번째 request 보내기