Day 699: dadumi 배포 및 일본어 ASR 평가

Source

  • Field Notes/ReturnZero/Daily Notes/Day 699. 2023-05-30.md

Summary

2023년 5월 30일 일기. ‘dadumi’ 서비스의 오후 배포를 계획 중이며, 일본어 ASR 모델(King-ASR-835)의 모노채널 샘플 평가 결과를 기록함. 특히 원격 회의 환경에서의 발화 인식 및 백색소음 조건에서의 성능을 확인함. 또한 Patrick의 Whisper small 파인튜닝 진행 상황(A100 GPU 8장 기준 3~4일 소요)과 cs-cat 서비스의 포커스 인터뷰 관찰을 언급함. 마지막으로 triton worker 호출 관련 디버깅 시도 및 환경 변수 설정 로그를 남김.

Key Points

  • dadumi 서비스의 오후 배포 예정
  • 일본어 ASR(King-ASR-835) 평가: 모노채널, 10분 길이 샘플, 원격 회의(단일 발화자), 백색소음 포함 Near-field 환경 테스트
  • Whisper small 파인튜닝 진행 중 (Patrick, A100x8, 3~4일 소요 예상)
  • cs-cat 서비스: 사용자 관찰을 위한 포커스 인터뷰 진행
  • Triton worker 호출 검증 및 verbose 모드 디버깅 시도