Day 693. 2023-05-24

Source

  • Field Notes/ReturnZero/Daily Notes/Day 693. 2023-05-24.md

Summary

이전 날의 성능 저하가 개발자의 실수였음을 확인하고 버그를 수정함. 현재 BLS 작업 지속 중이며, VAD 모델의 한국어 적용, 구글 노이즈 처리 성능 평가(약 70% 수준), 온라인 Pronaia 적용 이슈 등을 논의 중. 또한 split_input, neural_itn, inference_with_handling_input_len 등 공통 처리 로직과 추상화 대상(self.tokenizer, inference)을 정리하고, 일본어 샘플 데이터 평가(CS 도메인?)를 검토 중.

Key Points

  • 이전 성능 저하 원인이 개발자 실수였으며, Dan의 도움으로 버그 수정 완료
  • BLS 작업 지속 및 VAD 모델 한국어 적용, 구글 노이즈 처리 성능(약 70%), 온라인 Pronaia 적용 이슈 논의
  • 공통 처리 로직(split_input, neural_itn, inference_with_handling_input_len 등) 및 추상화 대상(self.tokenizer, inference) 정리
  • 일본어 샘플 데이터 평가(CS 도메인?) 검토 중