2024-11-27 작업 기록: 일본어 BMT 실험 및 Pronaia 서버 리팩토링

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1246. 2024-11-27.md

Summary

본 노트는 2024 년 11 월 27 일의 작업 일지로, 일본어 음성 인식 (BMT) 모델의 키워드 부스팅 실험과 Pronaia 서버의 API/Task Worker 구조 리팩토링 의제를 다룹니다. 일본어 처리에서는 공백 유무에 따른 부스팅 효과 비교와 ‘고로’ 처리 문제, ‘replacer’ 도입 필요성을 기록했습니다. 서버 측면에서는 메시지 큐 기반의 Task Worker 설계, API 버전 관리, 그리고 Transcriber 에서 TaskWorker 로의 개념 전환을 논의하고 있습니다.

Key Points

  • 일본어 BMT 실험: 키워드 부스팅 시 공백 포함/미포함 케이스의 장단점 비교 및 혼합 전략 필요성 확인
  • 일본어 처리 이슈: ‘고로’ 처리 실패 사례 기록 및 ‘replacer’ 로직 도입 고려 (예: 一軒家)
  • Pronaia 서버 리팩토링: 메시지 큐를 통한 Task Worker 설계 및 API 버전 (EngineVersion) 에 따른 처리 분기 논의
  • 명명 규칙 변경: Transcriber/TranscribeResponse 에서 TaskWorker/TaskResponse 로의 개념 및 명칭 전환 검토
  • 기타 업무: 신한카드 주시, PII 모델 이슈, dadumi-worker, 디렉토리 정리 등 일상적 업무 항목 포함