2025-11-04 업무: L40S Whisper 실시간 성능 검증 및 MWW 모델 훈련

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1588. 2025-11-04.md

Summary

2025년 11월 4일 업무 기록으로, 주요 이슈는 L40S GPU 환경에서의 Whisper 실시간 인식(RTFx) 성능 검증과 MWW(오뚜기) 프로젝트의 음성 인식 모델 훈련 결과 확인이다. L40S 환경에서는 드라이버 장애 해결 후, 다양한 채널 수(50300)와 동시성(concurrency) 조건에서 일본어 인식 성능을 테스트하여 RTFx 40120 범위 및 지연 시간(Latency) 분포를 측정했다. 또한 MWW 프로젝트에서는 기존 w2v-100m 대비 신규 m2v-250m/100m 모델의 정확도(90.45% vs 91.83%)를 비교하고, Sims/Doomfi 환경에서의 훈련 상태를 점검했다. 부산소방 서비스 노출 상태 확인 및 SuperLawyer 명함 찾기 기능 포기 등 기타 업무도 포함된다.

Key Points

  • L40S Whisper 실시간 성능 검증: L40S GPU 환경에서 Whisper TRT-LLM 기반 실시간 인식 성능을 다양한 채널 수 및 동시성 조건으로 테스트함.
  • 성능 측정 결과: 채널 수 증가 및 동시성 증가에 따라 RTFx는 40~120 사이로 변동하며, 지연 시간(Latency)이 증가하는 경향을 보임. 특히 고부하 시 99% 타일 지연 시간이 크게 증가함.
  • MWW(오뚜기) 모델 훈련: 기존 w2v-100m 모델(91.83%) 대비 신규 m2v-250m 모델(90.45%)의 정확도 하락 확인. m2v-100m 모델 훈련 진행 중.
  • 환경 설정 및 문제 해결: L40S 드라이버 재설치로 장애 해결. Istio, Prometheus, GPU Operator 등 Kubernetes 환경 설정 및 RTZR-STT 서비스 배포 과정 기록.
  • 기타 업무: 부산소방 서비스 Nodeport 설정 확인, SuperLawyer 명함 찾기 기능 개발 포기.