2023-05-12 일본어 모델 학습 및 얼라인, ITN 서비스화 진행 상황

Source

  • Field Notes/ReturnZero/Daily Notes/Day 681. 2023-05-12.md

Summary

2023 년 5 월 12 일의 작업 기록으로, 일본어 베이스모델 재학습 결과 확인, Levenshtein 기반 얼라인 (Alignment) 구현 중 발생한 버그 (타임스탬프 순서 오류, 구두점 영향 등) 및 해결 시도, 그리고 T4 GPU 환경에서의 ITN 모델 서비스화 (Triton Inference Server) 과정과 공유 메모리 오류 해결 내용을 담고 있다.

Key Points

  • 일본어 모델: 0403 베이스모델 학습 성공 확인, 0414 MWW 데이터 학습 시 문제 발생 가능성 확인 필요
  • 얼라인 (Alignment): Levenshtein 패키지로 재구현 중, 문장 구분 및 온점 처리, 화자 구분 (spk id) 로직 개선 필요
  • 얼라인 버그: 타임스탬프 순서 오류 및 구두점 존재 시 매핑 결과 왜곡 현상 발견, 구두점 제거 후 복구 방안 모색 중
  • ITN 서비스화: T4 GPU 에서 Triton 서버 구동 시 shared memory 부족 오류 발생, shm-size 조정 (256->512) 후 정상 구동
  • 기타: GPT dadumi 작업 중 프로나이가 타임스탬프 미제공으로 인한 문제 발생