Day 497. 2022-11-09

Source

  • Field Notes/ReturnZero/Daily Notes/Day 497. 2022-11-09.md

Summary

ReturnZero 프로젝트의 전사(TTS) 파이프라인 최적화를 위한 실험 기록이다. 맞춤법 검사기 구축을 위해 rtboost 유틸리티를 활용하고, ITN(Inverse Text Normalization) 모듈 적용 결과를 확인했다. 특히 여러 발화를 하나의 텍스트로 합칠 때 원본 구조를 복원하기 위해 구분자(|)를 삽입하는 방식을 테스트했으며, 네이버 API 및 부산대 API의 스펙(자수/어절 제한)을 비교 검토했다.

Key Points

  • 맞춤법 검사기 구축을 위해 rtboost 유틸리티 활용 검토
  • 전사 파이프라인의 ITN 적용 및 모듈별 결과 확인
  • 다중 발화 합치기 시 원본 복원을 위한 구분자(|) 삽입 방식 테스트 성공
  • 네이버 API(500자 제한)와 부산대 API(300어절 제한)의 스펙 비교