Passer au contenu principal

Fonctionnement du routage

YouRouter propose deux modes pour router vos requêtes API : automatique et manuel. Ce comportement est contrôlé par l’en-tête vendor.

Comportement par défaut : routage automatique (auto)

Pour une fiabilité maximale, nous recommandons le mode de routage automatique. C’est le comportement par défaut si vous omettez l’en-tête vendor ou le définissez sur auto. En mode auto, YouRouter route intelligemment votre requête vers le fournisseur le plus disponible et le plus adapté au modèle demandé. Par exemple, si vous demandez gpt-4o et que l’API OpenAI subit de la latence, nous basculons de façon transparente vers un autre fournisseur comme Azure OpenAI pour traiter la requête sans interruption. C’est le réglage idéal pour la production lorsque la haute disponibilité est critique.

Routage manuel : choisir un fournisseur

Si vous devez utiliser un modèle précis chez un fournisseur donné ou accéder à une fonctionnalité exclusive à ce fournisseur, routez manuellement la requête en définissant l’en-tête vendor sur l’identifiant du fournisseur souhaité. Par exemple, pour garantir que votre requête gpt-4o soit traitée par Azure, incluez vendor: azure dans les en-têtes de la requête.
from openai import OpenAI

client = OpenAI(
    api_key="your-api-key-here",
    base_url="https://api.yourouter.ai/v1"
)

# Fixer la requête sur un fournisseur précis (ex. Azure)
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "Hello from Azure OpenAI!"}],
    extra_headers={"vendor": "azure"}
)

print(response.choices[0].message.content)

Fournisseurs disponibles

FournisseurValeur vendor
Anthropicanthropic
AWS Bedrockaws
Azure OpenAIazure
DeepSeekdeepseek
Googlegoogle
Mistral AImistral
OpenAIopenai
Volcenginevolcengine
xAIx

Assurance zéro complétion

Notre politique de facturation équitable garantit que vous ne payez que pour des réponses réussies et non vides. Vous n’êtes pas facturé pour les requêtes qui se terminent par une erreur (par ex. code HTTP 500) ou qui renvoient zéro jeton de complétion. Il s’agit de notre Assurance zéro complétion, activée par défaut sur toutes les requêtes.

Bonnes pratiques

  • Utilisez auto en production : pour toute application où la disponibilité compte, nous recommandons fortement le mode auto par défaut afin de bénéficier du basculement automatique et du routage haute disponibilité.
  • Routage manuel pour des besoins spécifiques : si vous avez besoin d’un modèle ou d’une fonctionnalité propre à un fournisseur, précisez le fournisseur avec l’en-tête vendor.
  • Documentation des fournisseurs : en routage manuel pour des fonctionnalités spéciales, référez-vous toujours à la documentation native du fournisseur pour les paramètres détaillés. Vous pouvez transmettre ces paramètres via YouRouter, comme expliqué dans le guide Transfert des requêtes.
Voir le guide Complétions de chat pour des exemples d’API plus détaillés.