일어 음성 처리 파이프라인 디버깅 및 ITN 수정

Source

  • Field Notes/ReturnZero/Daily Notes/Day 671. 2023-05-02.md

Summary

일본어 음성 데이터 처리 과정에서 샘플링 레이트 불일치(8k vs 16k)로 인한 세그먼트 오류를 발견하고, 일본어 코드모델의 숫자 처리 시 하이픈 생성 문제를 triton-itn 수정으로 해결하는 과정을 기록함. 아울러 ITN 모델 배포 및 신한/심플 이데아 관련 일정 메모 포함.

Key Points

  • 일본어 음성 세그먼트 복구 시도 중 샘플링 레이트 불일치(8k 원본 vs 16k 처리)로 인한 시간축 어긋남 및 단절 문제 발생
  • 구두점 제거 등 전처리 시도 후에도 근본적인 샘플링 레이트 문제 확인
  • 일본어 코드모델의 숫자 연속 발화 시 하이픈 생성 로직 오류(불필요한 하이픈 추가/누락) 발견 및 triton-itn 수정으로 해결
  • ITN 모델 AWS 배포 및 rtnlp 이미지 업데이트 진행
  • 신한 헬로우데이(5/10) 및 심플 이데아(성경 암송앱) 관련 업무 메모