適切なエンドポイントの選択
FourAは3つのAPI endpointを提供しており、それぞれ異なるシナリオに最適化されています。適切なものを選択することで、時間を節約し、コストを削減し、成功率を向上させることができます。
クイック決定ガイド
single endpointを使用する場合:
- ターゲットページがサーバーサイドレンダリングされている(JavaScriptが不要な場合)
- 最大限の速度が必要な場合(通常は1秒未満)
- APIまたは静的なHTMLページからデータを収集する場合
browser endpointを使用する場合:
- ページがコンテンツのレンダリングにJavaScriptを必要とする場合
- 初期ページロードの後にコンテンツが動的に読み込まれる場合
- 完全にレンダリングされたDOMが必要な場合
proxy endpointを使用する場合:
- ターゲットサイトがリクエストを能動的にブロックしている場合
- 複数のIPアドレスをローテーションさせる必要がある場合
- 以前の試行で403エラーまたはCAPTCHAページが返された場合
エンドポイントの比較
Single (POST /api/single/)
最も高速なオプションです。browserプロセスを起動することなく、実際のbrowserに近い通信特性を持つHTTP requestを送信します。
curl -X POST https://eu.api.foura.ai/api/single/ \
-H "X-API-Key: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{"method": "GET", "url": "https://example.com/api/products", "unblocker": true}'
一般的な応答時間: 200msから2s 最適な用途: API、ニュースサイト、ブログ、静的な商品ページ
Browser (POST /api/browser/)
Chrome browserのインスタンスでURLを開きます。ページが完全に読み込まれ、JavaScriptが実行され、最終的にレンダリングされたHTMLを取得できます。
curl -X POST https://eu.api.foura.ai/api/browser/ \
-H "X-API-Key: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"url": "https://example.com/spa-app",
"timeout_ms": 15000,
"checkText": "data-table"
}'
一般的な応答時間: 2sから10s 最適な用途: シングルページアプリケーション(SPA)、遅延読み込みのあるサイト、JavaScriptでレンダリングされるコンテンツ
Proxy (POST /api/proxy/)
HTTP requestと自動proxyローテーションを組み合わせます。最初の試行が失敗するかブロックされた場合、FourAは異なるproxyを経由して再試行します。
curl -X POST https://eu.api.foura.ai/api/proxy/ \
-H "X-API-Key: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"maxTries": 5,
"request": {
"method": "GET",
"url": "https://example.com/pricing",
"unblocker": true
}
}'
一般的な応答時間: 1sから5s 最適な用途: Eコマースの価格監視、旅行情報の集約、ボット検知機能のあるサイト
アプローチを組み合わせるタイミング
一部のワークフローでは、複数のendpointを使用することでメリットが得られます。
- まずsingleから開始する: browserを使用せずにページが有用なデータを返すかどうかをテストします。
- browserにフォールバックする: responseが空であるかコンテンツが不足している場合は、browserレンダリングに切り替えます。
- proxyを追加する: ブロックされている場合(403やCAPTCHA)、リクエストをproxy endpointでラップして自動IPローテーションを行います。
この段階的なアプローチにより、コストを低く抑えながら成功率を最大化できます。
パフォーマンスに関するヒント
- デフォルトではsingle endpointを使用し、必要な場合にのみアップグレードします
- 不要なコンテンツを待つことを避けるため、browserリクエストで
checkTextを設定します - proxyリクエストで
maxTriesを設定して再試行動作を制御します(デフォルトは5、最大は90) timeout_msの値を適切に保ちます: ほとんどのページで10から15秒
次のステップ
- API Endpoints: 完全なパラメータリファレンス
- Scrape a Dynamic Website: ステップバイステップのbrowserリクエストガイド
- Quick Start: 30秒で完了する最初のリクエスト