일본어 TTS/ASR 파싱 및 인프라 요구사항 (Day 791)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 791. 2023-08-30.md

Summary

일본어 음성 처리 파이프라인에서 외래어(특히 한국 지명)의 가타카나 전사 규칙 검토, 특정 단어의 블랙/화이트리스트 관리, 그리고 ASR 요청 시 workspace 기반 호스트 라우팅 로직 변경 요구사항을 기록한 일일 메모.

Key Points

  • 일본어 외래어 이중전사 시 한국 한자 지명(강원, 인천 등)의 가타카나 표기 적절성 검토 필요
  • 특정 단어(예: V LIVE, CHOOSE IMAGES…)는 블랙리스트, K7/EXO 등은 화이트리스트로 관리
  • ASR 요청 시 workspace 파라미터를 호스트 URL의 prefix/suffix로 붙이는 라우팅 로직 구현 필요
  • rtboost, VITS2, SOME3 등 관련 기술/프로젝트 언급