Project S2 Kickoff 및 일본어 STT/NLP 문제 정의

Source

  • Field Notes/ReturnZero/Daily Notes/Day 701. 2023-06-01.md

Summary

24개월차 일기로서, ‘Project S2’의 킥오프를 통해 음성 인터페이스(STT/NLP)의 문제 정의와 우선순위를 설정했다. 주요 도메인(CS, 영업, 회의)과 세일즈 전략(대기업 타겟팅)을 논의하며, 일본어 Whisper 모델의 파인튜닝 필요성을 확인했다. 원문은 일본어 음성 인식(STT) 테스트 결과에 대한 상세한 에러 로그(장음 인식 실패, 한자 변환 오류, 고유명사 오인식 등)로 구성되어 있어, 모델 개선의 구체적인 방향성을 제시한다.

Key Points

  • Project S2 Kickoff: 음성 인터페이스(STT/NLP)를 핵심 기술 문제로 정의
  • NLP 우선순위: 요약, 주제탐지, 감정분석, NER, 민감정보 제거
  • 도메인 적용: CS, AICC, 회의록, 영업통화
  • 세일즈 전략: MSP 및 전화 사용 기업 등 ‘큰 고객’ 확보
  • 기술 과제: 일본어 Whisper 내재화 및 파인튜닝 (Patrick 계획 포함)
  • STT 에러 패턴: 장음 인식 실패, 한자 변환 오류(동음이의어), 고유명사/주소 오인식, ITN(Inverse Text Normalization) 한계