メインコンテンツへスキップ

ルーティングの考え方

YouRouter には 自動手動(固定) の 2 モードがあり、挙動は vendor ヘッダーで制御します。

デフォルト:自動ルーティング(auto

可用性を最大化するなら自動ルーティングを推奨します。vendor を省略するか auto にします。 auto では、モデルに対してコストと可用性を踏まえて最適な上流へ振り分けます。例として gpt-4o 要求時に OpenAI 側が遅延していれば、Azure OpenAI などへフェイルオーバーするケースがあります。

手動:プロバイダーを固定する

特定上流のモデル亜種や固有機能が必要な場合、vendor にプロバイダー ID を指定します。 例:Azure へ固定したい場合は vendor: azure を付けます。
from openai import OpenAI

client = OpenAI(
    api_key="your-api-key-here",
    base_url="https://api.yourouter.ai/v1"
)

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "Hello from Azure OpenAI!"}],
    extra_headers={"vendor": "azure"},
)

print(response.choices[0].message.content)

利用可能なプロバイダー(例)

Providervendor
Anthropicanthropic
AWS Bedrockaws
Azure OpenAIazure
DeepSeekdeepseek
Googlegoogle
Mistral AImistral
OpenAIopenai
Volcenginevolcengine
xAIx

Zero Completion Insurance(ゼロ完了保険)

成功かつ非空の応答に対してのみ課金されます。500 などのエラーや completion token が 0 のケースでは課金されません。全リクエストでデフォルト有効です。

ベストプラクティス

  • 本番は auto を優先:フェイルオーバーと高可用性の恩恵が大きいです。
  • 固有要件があるときだけ固定:モデルや機能が特定上流に依存する場合に vendor を使います。
  • 上流ドキュメントを参照:固有パラメータは各プロバイダーの公式ドキュメントを確認し、リクエスト転送 の通り透過できます。
詳細な API 例は Chat Completions を参照してください。