시나리오 5: 실제 데이터셋 테스트
이 시나리오를 사용해야 하는 경우:
실제 사용자 프롬프트와 쿼리 패턴으로 프로덕션 준비 성능을 검증하기 위해 실제 데이터셋 테스트를 사용하십시오. 이것은 모델이 특정 대화 패턴에 맞게 미세 조정되었을 때, 실제 성능 보장이 있는 모델 버전을 비교할 때, 또는 이해관계자에게 "이것은 이론적 데이터가 아닌 실제 대화에서 어떻게 수행되는지입니다"라고 말해야 할 때 필수적입니다. 분포에 대한 제어가 적어지는 트레이드오프가 있지만, 진정성과 합성 데이터가 놓치는 엣지 케이스를 발견하는 능력을 얻습니다.
배포
Helm 차트 사용 (권장)
# AI on EKS Helm 저장소 추가
helm repo add ai-on-eks https://awslabs.github.io/ai-on-eks-charts/
helm repo update
# ShareGPT 데이터셋 테스트는 동일한 시나리오를 사용하지만 실제 데이터 사용
helm install sharegpt-test ai-on-eks/benchmark-charts \
--set benchmark.scenario=baseline \
--set benchmark.target.baseUrl=http://qwen3-vllm.default:8000 \
--set benchmark.target.modelName=qwen3-8b \
--set benchmark.target.tokenizerPath=Qwen/Qwen3-8B \
--namespace benchmarking --create-namespace
# 자연스러운 대화 복잡성 패턴 모니터링
kubectl logs -n benchmarking -l app.kubernetes.io/component=benchmark -f
참고: 실제 데이터셋 테스트는 시나리오 1-4와 동일한 부하 패턴을 사용하지만, data.type: synthetic 대신 data.type: shareGPT를 사용합니다. 모든 시나리오(baseline, saturation, sweep 또는 production)에 실제 데이터를 적용할 수 있습니다.
사용자 정의 데이터셋 사용
자체 대화 데이터셋 제공:
# custom-dataset.yaml
benchmark:
scenario: saturation # 또는 다른 시나리오
target:
baseUrl: http://your-model.your-namespace:8000
# 사용자 정의 데이터셋을 사용하도록 데이터 구성 재정의
customData:
enabled: true
type: custom
path: /path/to/your/conversations.json
format: sharegpt # 또는 openai, alpaca 등
사용자 정의 데이터셋의 경우 ConfigMap 또는 PersistentVolume을 사용하여 데이터 파일을 벤치마크 Pod에 마운트해야 합니다.