2026-02-03 업무: 일본어 ASR 모델 개선 및 Triton 배포 환경 최적화

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1679. 2026-02-03.md

Summary

본 노트는 2026 년 2 월 3 일의 업무 기록으로, 일본어 음성 인식 (ASR) 모델의 성능 개선을 위한 데이터 정제 및 전사 전략 (특히 ‘데스’ 처리 및 가타카나 모델) 을 논의하고 있다. 또한 현대캐피탈 프로젝트에서 Triton Server 배포 시 Python 환경 주입을 위해 conda-pack 을 활용하는 기술적 해결책을 기록하고 있으며, 팀 내 포커스 미팅을 통한 재택 근무 정책 및 사이드 프로젝트 가이드라인에 대한 논의 내용을 포함한다.

Key Points

  • 일본어 ASR 모델 개선: 주소/번호 모델의 ‘데스’ 처리 방식 변경 (전사 후 ITN 에서 제거), 필러 문제 해결, 가타카나 전사 모델 개발 계획
  • 데이터 파이프라인: 일본어 TTS 데이터 생성 및 정제, pysommers 화 진행, 2 월 4~5 일 훈련 일정 예정
  • Triton Server 최적화: conda-pack 을 사용하여 Python 라이브러리 환경을 모델 디렉토리에 주입함으로써 이미지 재빌드 없이 배포 환경 구성
  • 조직 운영: 포커스 미팅을 통한 재택 근무 승인제 논의, 사이드 프로젝트 장려 및 본업 영향 최소화 방안 모색