기대할 수 있는 동작
| 범위 | 동작 |
|---|---|
| YouRouter 게이트웨이 | 제공업체마다 별도 엔드포인트를 만들 필요가 없습니다. |
| 제공업체 제한 | 상위 제공업체가 속도 제한 또는 동시성 오류를 반환할 수 있습니다. |
| 자동 라우팅 | vendor를 생략하거나 vendor: auto로 설정하면 YouRouter가 사용 가능한 제공업체로 라우팅합니다. |
| 제공업체 고정 | vendor를 명시하면 해당 제공업체의 가용성과 속도 제한에 의존합니다. |
권장 재시도 패턴
모델 API 호출에는 일시적 실패에 대해 지수 백오프로 재시도하는 것이 좋습니다.429속도 제한 또는 동시성 초과500게이트웨이 또는 제공업체 오류- 일시적 네트워크 장애
동시성 권장 사항
- 프로덕션에서는 보수적인 동시성으로 시작한 뒤 점진적으로 늘리세요.
- 제공업체를 명시적으로 고정할 필요가 없다면
vendor: auto를 우선하세요. - 모델 ID는 설정으로 관리해 모델 전환 시 코드 변경을 줄이세요.
- 문제 해결을 위해 요청 시각, 모델, vendor 모드, 요청 ID를 기록하세요.
- 스트리밍 응답은 애플리케이션이 해당 요청을 안전하게 재시작할 수 있을 때만 연결 끊김을 재시도 가능한 오류로 간주하세요.