신한은행 다국어 음성인식 벤치마킹 및 IT 인프라 이슈

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1414. 2025-05-14.md

Summary

신한은행용 설치형 다국어 음성인식 엔진 소개자료 작성을 위해 경쟁사(한국 B2B, Whisper 기반, 클라우드/온프레미스)의 기술 스펙(WER, 지연시간, 화자 분리 등)과 검증 가능한 데이터셋을 조사해야 함. 현재 전략은 Whisper 파인튜닝 + DeepL 번역 연동. 병행하여 ITN(Inverse Text Normalization)의 외국어 처리 버그(Sentry 이슈)와 두나무 재전사 작업의 인프라 제약(EFS, VPC 서브넷), IBK 네트워크 드라이버 문제 등 운영 이슈가 발생함.

Key Points

  • 신한은행 프로젝트: 설치형 다국어 음성인식 소개자료 제작을 위한 경쟁사 벤치마킹 필요
  • 기술 전략: Whisper 파인튜닝(음성인식) + DeepL(번역) 연동 방식
  • 벤치마킹 항목: 전사 정확도(WER), 번역 성능, 실시간성(지연), 화자 분리, 사후처리(키워드 부스팅 등), 공개 코퍼스
  • 경쟁사 범위: 한국 B2B 기업 중심, Whisper 기반 서비스, 클라우드/온프레미스 혼합 조사
  • 운영 이슈 1: ITN 모듈에서 외국어 처리 시 ‘words’ 누락으로 인한 Index Error 발생
  • 운영 이슈 2: 두나무 재전사 작업의 인프라 제약(EFS 영향, VPC 서브넷 확장 불가)
  • 운영 이슈 3: IBK 서버의 네트워크 드라이버(igb) 및 커널 업그레이드 문제