WFST/GOP 개발 및 기술적 고민 (2022-07-13)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 378. 2022-07-13.md

Summary

WFST 기반 텍스트 처리 로직(특히 top_rewrite 동작 원리 및 숫자/띄어쓰기 처리 규칙)에 대한 기술적 분석과 GOP 프로젝트의 인프라(DB 스키마, Airflow 배포) 관련 안건을 정리한 일일 작업 기록입니다.

Key Points

  • WFST top_rewrite 함수의 shortest-path 출력 및 tie resolution 정책 확인 필요
  • 특정 문자열 처리 로직(띄어쓰기, ‘거야’, 숫자 단위 ‘만/천/백/십’ 처리)에 대한 구현 세부사항 논의
  • GOP 프로젝트의 DB 스키마, Airflow 배포 및 모델 파일 업로드 경로 등 인프라 안건 정리