Day 665: ITN 모델 배포 장애 및 환경 정리

Source

  • Field Notes/ReturnZero/Daily Notes/Day 665. 2023-04-26.md

Summary

2023-04-26 일지. ITN(Inverse Text Normalization) 모델 배포 과정에서 모델 파일 관리의 비효율성(3개 위치 분산)과 토크나이저의 입력 길이 제한(128 토큰 초과 시 에러)으로 인한 실패를 기록함. NFS 심볼릭 링크 공유를 통한 환경 통합을 시도했으며, Kubernetes(Lens)를 이용한 배포 상태 확인과 관련 팀원 공지 등을 진행함. 일본어 CS 상담 데이터 수집 및 협력사(TN) 관련 논의는 당장 시급하지 않다고 판단함.

Key Points

  • ITN 모델 배포 실패 원인: 모델 파일의 분산 관리(개발/NFS/보관용 3곳) 및 토크나이저의 128 토큰 길이 제한
  • 해결 시도: NFS 간 심볼릭 링크(/nfs/home -> /nfs/train) 설정을 통한 모델 파일 통합
  • 배포 작업: OpenLens 설치를 통한 Kubernetes 파드 상태 모니터링, Jenkins 빌드 실행, 개발 중단 공지
  • 미해결/검토 사항: 토크나이저 방어 코드 추가 필요성, ITN 기능 정상 동작 여부 재확인
  • 일본어 프로젝트: CS 상담 데이터 지속 수집 가능하나, 당장 의사결정이나 개발이 시급하지 않음