2023-02-24 작업 기록: 일본어 STT 조사 및 통합 ITN 설계

Source

  • Field Notes/ReturnZero/Daily Notes/Day 604. 2023-02-24.md

Summary

2023 년 2 월 24 일의 작업 일지로, 일본어 STT 의 영문 - 가타카나 변환 (Alphabet2Kana) 관련 라이브러리 조사와 그 한계점 분석, 통합 ITN(Inverse Text Normalization) 을 위한 ‘turn’ 자료형 설계 및 레반슈타인 거리 적용 검토, 그리고 신한은행 배포 준비 (Triton 이미지 구성) 가 주요 내용이다.

Key Points

  • 일본어 STT 영문 변환 도구 조사: sljfaq, e2j-name(구식/저품질), alphabet2kana(킹이썬 기반), transcript(CMU 발음사전 기반, 일본식 발음 반영 실패) 등 비교 분석
  • 통합 ITN 설계: ‘turn’ 단위 자료형 정의 필요성 제기 및 turn 기반 레반슈타인 거리 계산 검토 (pysommers 의 256 자 제한 고려)
  • 하이라이터 기능: 테스트 케이스 추가 필요성 인지
  • 신한은행 배포 준비: Triton 이미지 빌드 시 모델 파일 포함 방안 및 torch 모델 준비 방식 검토
  • 데이터셋: 초기 데이터 확보 및 yl-dlp 사용법 학습 예정