2026-02-08 업무: 일본어 ASR 모델 개선 및 웰컴 프로젝트 인프라 구축

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1684. 2026-02-08.md

Summary

본 노트는 2026년 2월 8일의 업무 기록으로, 크게 두 가지 핵심 주제를 다룬다. 첫째, 일본어 음성 인식(ASR) 모델의 개선 사항으로, 주소 및 번호 모델의 ‘데스(Death)’ 처리 방식 변경(전사 후 ITN에서 제거), 필러 문제 해결, 가타카나 전사 모델 개발 및 언어모델 서프레스 적용 등을 포함한다. 둘째, ‘웰컴’ 프로젝트 관련 인프라 구축 작업으로, PII 및 ITN 모델의 반입 준비, L40_N2501 프로필 부재로 인한 모델 빌드 문제 해결, 그리고 Kubernetes 클러스터 간 통신을 위한 방화벽 설정(ipset 활용)과 Ansible 플레이북 자동화, 시스템 리소스 제한(fsnotify, containerd) 조정 등이 상세히 기록되어 있다.

Key Points

  • 일본어 ASR 모델 개선: 주소/번호 모델의 데스 처리 로직 변경, 필러 문제 해결, 가타카나 전사 모델 개발 계획
  • 웰컴 프로젝트 모델 준비: PII 및 ITN 모델 반입, L40_N2501 프로필 부재 시 ckobert 기반 모델 빌드 및 업로드
  • 인프라 설정: Kubernetes 노드 간 통신을 위한 firewalld ipset 설정 및 Ansible 플레이북 자동화
  • 시스템 튜닝: containerd 파일/프로세스 제한(LimitNOFILE/NPROC) 증가 및 fs.inotify 설정 최적화