다듬이: 일본어 ITN 및 배포 준비

Source

  • Field Notes/ReturnZero/Daily Notes/Day 656. 2023-04-17.md

Summary

다듬이 프로젝트의 릴리즈 준비 및 배포 시스템(Jenkins) 설정을 논의하며, 도커 환경 설정 오류 해결 과정을 기록함. 핵심은 일본어 ITN(Inverse Text Normalization) 모델의 세부 규칙 정의와 Triton-itn 도메인(address, code, general)별 처리 로직(한자/가타카나/히라가나 변환 및 필터링)에 대한 기술적 검토임.

Key Points

  • 다듬이 릴리즈 준비 완료 및 vito-worker 자체 시험 완료, Jenkins 기반 배포 시스템 구축 필요
  • BMT 테스트에 ITN 테스트 추가를 위한 브랜치 분기 계획
  • 일본어 ITN 모델별 규칙 정의: 주소(address) 모델은 한자/가타카나 변환 및 알파벳 ITN 비활성화, 코드(code) 모델은 알파벳 ITN 활성화 및 특수 문자 필터링
  • Triton-itn 도메인(address, code, general)별 처리 로직 및 use_mecab 대신 domain 기반 설정 변경 검토
  • 도커 재설치 시 API 지정 오류로 인한 문제 발생 및 해결