갓본어 일반회화 모델 개선 및 OpenAPI/Istio 네트워크 문제 조사

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1219. 2024-10-31.md

Summary

이 노트는 ‘갓본어’ 음성 인식 모델의 일반회화 성능 저하(단어 오인식, 숫자 문제)를 해결하기 위한 워드부스팅 및 추가 데이터 수집(회의록, TED 등) 방안을 논의한다. 또한, OpenAPI 서비스의 연결 불안정 문제를 Istio Gateway 및 파드 IP 변경 가능성과 연관지어 네트워크 상태(keepalive, 재시도 패턴)를 분석하고 있다.

Key Points

  • 음성 인식 모델의 단어 오인식 및 숫자 처리 문제 해결을 위해 워드부스팅 리스트 보완 필요
  • 모델 학습을 위한 추가 데이터 소스 확보: MWW 회의 데이터(Whisper 전사), YouTube/TED 공개 데이터셋
  • OpenAPI 서비스의 연결 끊김 문제 조사: Istio Gateway 설정 또는 파드 IP 재할당 가능성 검토
  • 네트워크 연결 상태 분석: keepalive 타이머 동작 및 재시도 패턴(9회차 이후 100초 간격) 관찰