KISA 프로젝트 준비 및 일본어 STT 모델 실험 (Day 1570)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1570. 2025-10-17.md

Summary

본 노트는 KISA 프로젝트의 R&D 서버 환경 확인, 비즈니스 로직 및 API 변경 사항 정리, 모델 준비 현황을 기록한다. 또한 일본어 STT 모델(7_2, 7_3)의 성능 저하를 해결하기 위한 incremental learning 실험(7_2_1, 7_2_2)과 7_4 모델 평가 결과를 포함한다. 부가적으로 두나무 보안 인터뷰 내용과 redis 대응 이슈, 현대캐피탈 일정도 언급된다.

Key Points

  • KISA R&D 서버 사양(VRAM, RAM, OS 등) 확인 필요 및 폐쇄망 이전 일정(10/27 이전) 확인
  • KISA 비즈니스 로직: 스팸팀 서버에서 1분 단위 배치 요청, STT Response API 변경(result, return_type, recognized 필드 구조화) 및 신규 API 개발
  • KISA 모델 준비: Ampere 복사 완료(Batch, Online, VAD, ITN, PII, WDIAR)
  • 일본어 STT: 7_2/7_3 상태 불량으로 인한 incremental learning 실험(7_2_1: place 높임, lr 15e-6; 7_2_2: 조정 후 학습) 진행
  • rtzr-stt-solution-stack-builder 배포 시 YAML 파일 내 duplicate anchor ‘model-default’ 오류 발생
  • 두나무 보안 인터뷰: 로그 저장 방식(AWS 파일 적재), 파일 포맷, 계정 정보 등 보안 요구사항 논의
  • 현대캐피탈: 21일 14~16시 회의, proto 파일 송부 예정