ルーティングの考え方
YouRouter には 自動 と 手動(固定) の 2 モードがあり、挙動はvendor ヘッダーで制御します。
デフォルト:自動ルーティング(auto)
可用性を最大化するなら自動ルーティングを推奨します。vendor を省略するか auto にします。
auto では、モデルに対してコストと可用性を踏まえて最適な上流へ振り分けます。例として gpt-4o 要求時に OpenAI 側が遅延していれば、Azure OpenAI などへフェイルオーバーするケースがあります。
手動:プロバイダーを固定する
特定上流のモデル亜種や固有機能が必要な場合、vendor にプロバイダー ID を指定します。
例:Azure へ固定したい場合は vendor: azure を付けます。
利用可能なプロバイダー(例)
| Provider | vendor 値 |
|---|---|
| Anthropic | anthropic |
| AWS Bedrock | aws |
| Azure OpenAI | azure |
| DeepSeek | deepseek |
google | |
| Mistral AI | mistral |
| OpenAI | openai |
| Volcengine | volcengine |
| xAI | x |
Zero Completion Insurance(ゼロ完了保険)
成功かつ非空の応答に対してのみ課金されます。500 などのエラーや completion token が 0 のケースでは課金されません。全リクエストでデフォルト有効です。
ベストプラクティス
- 本番は
autoを優先:フェイルオーバーと高可用性の恩恵が大きいです。 - 固有要件があるときだけ固定:モデルや機能が特定上流に依存する場合に
vendorを使います。 - 上流ドキュメントを参照:固有パラメータは各プロバイダーの公式ドキュメントを確認し、リクエスト転送 の通り透過できます。