2026-02-26 업무 일지: 일본어 ASR 개선 및 S2 리빌드

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1702. 2026-02-26.md

Summary

본 노트는 2026년 2월 26일의 업무 기록으로, 주요 과제로 일본어 ASR(주소, 번호, 가타카나 모델)의 전사 및 ITN(Inverse Text Normalization) 로직 개선, 그리고 S2(SIMS) 온프레미스 솔루션의 리빌드 및 문서화가 기록되어 있다. 일본어 모델에서는 ‘데스(desu)‘와 같은 필러 처리 방식 변경 및 TTS 데이터 생성이 핵심 이슈이며, S2 리빌드에서는 스택빌더 설정과 설치 매뉴얼 정리가 완료된 것으로 보인다. 또한 웰컴저축은행 프로젝트의 도메인 인증서 설정 및 IBK 프로젝트의 인프라 준비 사항이 포함되어 있다.

Key Points

  • 일본어 ASR 모델 개선: 주소(번지수), 번호(데스/필러 처리), 가타카나 전사 모델 개발 중
  • 일본어 데이터 파이프라인: TTS를 활용한 자연스러운 발화 데이터 생성 및 정제(pysommers) 진행
  • S2(SIMS) 리빌드: 스택빌더 설정 완료 및 온프레미스 설치 매뉴얼/커리큘럼 문서화
  • 인프라 작업: 웰컴저축은행의 Kubernetes TLS 인증서(SAN) 설정 검증, IBK 프로젝트의 Kubespray/A100 환경 준비