테스트 시나리오
이 섹션은 LLM 추론 성능 벤치마킹을 위한 실용적인 테스트 시나리오를 제공합니다. 각 시나리오는 특정 테스트 목표와 사용 사례를 다룹니다.
사용 가능한 시나리오
합성 데이터와 실제 데이터셋 테스트 중 선택
벤치마킹에 합성 데이터와 실제 데이터를 언제 사용해야 하는지와 데이터셋 선택을 위한 모범 사례를 이해합니다.
시나리오 1: 베이스라인 성능
경쟁 없이 시스템의 최적 성능을 확립합니다. 대기열이나 리소스 경쟁 없이 최상의 성능을 이해하는 데 이상적입니다.
사용 시기:
- 새 엔드포인트를 방금 배포했을 때
- 인프라를 변경했을 때
- 최적화를 위한 깨끗한 참조 지점이 필요할 때
시나리오 2: 포화 테스트
다단계 부하 테스트를 통해 성능이 저하되기 전 최대 지속 가능한 처리량을 결정합니다.
사용 시기:
- 용량 계획 시
- 오토스케일링 임계값 설정 시
- 프로덕션 출시 전 검증 시