현재 요청
0 대기0
실행 중 요청
0
대기 중 요청
현재 실행 추정
-
토큰 속도
vLLM0.0 tok/s
생성 토큰
0.0 tok/s
프롬프트 처리
KV Cache
GPU0.0%
-
메모리
Unified0.0 / 0.0 GiB
-
서비스 Health
확인 중GPU
NVIDIA디스크
/0.0 / 0.0 GiB
-
최근 vLLM 요청
access| 서비스 | 요청 | 상태 |
|---|
최근 엔진 상태
engine| Run | Wait | Gen | KV |
|---|
컨테이너
네트워크: 수신 / 송신| 이름 | CPU | 메모리 | 수신 | 송신 |
|---|