본문으로 건너뛰기

벤치마킹 가이드 (Inference Perf 사용)

이 가이드에서 다루는 내용

이 가이드는 LLM 추론 성능 벤치마킹에 대한 포괄적인 접근 방식을 제공합니다:

벤치마크 과제 이해하기 - LLM 벤치마킹이 복잡한 이유와 기존 AI 모델과의 차이점
LLM 벤치마킹을 위한 핵심 메트릭 - 필수 메트릭(TTFT, ITL, TPS)과 배포에서의 의미
Inference Perf로 벤치마킹하기 - 표준화된 Inference Perf 도구를 사용한 성능 측정
테스트 시나리오 - 베이스라인, 포화, 프로덕션 시뮬레이션 및 실제 데이터셋 테스트를 위한 실용적인 예제
리소스 - 완전한 배포 예제 및 참조 구성

이 가이드에서 다루는 내용