MWW 일본어 주소 모델 성능 개선 및 WFS 문제 진단

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1161. 2024-09-03.md

Summary

2024-09-03 일일 업무 노트로, MWW(Multi-Word Word?) 일본어 주소 인식 모델의 성능 저하 원인을 분석하고 개선하는 과정이 기록되어 있습니다. 주소 관련 인식 오류가 특정 시점(240613) 이후 발생하며, TRT(TensorRT)가 아닌 WFS(Waveform Feature System? 또는 관련 파이프라인) 문제임을 확인했습니다. 여러 버전의 테스트 결과, CER(Character Error Rate) 100% 달성 등 성능 개선 효과를 확인했으며, EKS 배포 및 Bastion 접근 문제 등 인프라 작업도 병행했습니다.

Key Points

  • MWW 일본어 주소 모델의 성능 저하 원인을 WFS 문제로 진단 (TRT 제외)
  • 240613 이후 주소 관련 인식 오류 발생, 옛날 모델은 정상 동작
  • 다양한 테스트 케이스(mww_test_0911_kanji 등)에 대한 CER, WER, SER 지표 비교 분석
  • 최종적으로 CER 100% 달성 등 성능 개선 효과 확인
  • MWW EKS 배포 시도 및 Bastion 접근 문제 발생 (담당자 휴가로 지연)
  • 가독성 Evaluator 추적 및 아이쏠라 운영계 준비 (Grafana + Prometheus)