Passer au contenu principal
YouRouter est conçu pour absorber du trafic d’API modèle en production via une seule intégration. Pour les appels modèle, vous devez tout de même mettre en place des nouvelles tentatives et une gestion de la concurrence standard, car les fournisseurs amont peuvent appliquer leurs propres limites.

À quoi s’attendre

DomaineComportement
Passerelle YouRouterPas besoin d’intégration séparée par point de terminaison pour chaque fournisseur de modèle.
Limites fournisseurLe fournisseur amont peut renvoyer des erreurs de limite de débit ou de concurrence.
Routage automatiqueOmettre vendor, ou utiliser vendor: auto, permet à YouRouter de router vers des fournisseurs disponibles pour le modèle demandé.
Fournisseur fixéSi vous définissez vendor, votre requête dépend de la disponibilité et des limites de ce fournisseur.

Modèle de nouvelle tentative recommandé

Pour les appels API modèle, réessayez les échecs transitoires avec un backoff exponentiel.
1re tentative : attendre 1 seconde
2e tentative : attendre 2 secondes
3e tentative : attendre 4 secondes
puis arrêter ou passer à une voie de repli
Réessayez pour :
  • les réponses 429 (limite de débit ou concurrence)
  • les erreurs 500 (passerelle ou fournisseur)
  • les pannes réseau temporaires
Ne relancez pas immédiatement en boucle serrée : cela peut aggraver les limites côté fournisseur.

Conseils de concurrence

  • Commencez avec une concurrence prudente en production et augmentez progressivement.
  • Utilisez vendor: auto sauf si votre intégration impose un fournisseur précis.
  • Gardez les ID de modèle configurables pour changer de modèle sans modifier le code.
  • Journalisez l’horodatage, le modèle, le mode vendor et l’ID de requête pour le diagnostic.
  • Pour le streaming, ne considérez une coupure comme réessayable que si votre application peut relancer la requête en toute sécurité.

Exemple : routage automatique

curl https://api.yourouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $YOUROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "messages": [
      {
        "role": "user",
        "content": "Reply with exactly: connected"
      }
    ]
  }'

Exemple : fixation du fournisseur

curl https://api.yourouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $YOUROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -H "vendor: openai" \
  -d '{
    "model": "gpt-4o",
    "messages": [
      {
        "role": "user",
        "content": "Reply with exactly: connected"
      }
    ]
  }'
Pour le comportement de routage, voir le guide Routage. Pour les champs de requête, voir Créer une complétion de chat.