TMN 미팅 및 Voice Agent 기술/비즈니스 현황 (2025-10-23)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1576. 2025-10-23.md

Summary

TMN 미팅을 통해 LLM 기반 Voice Agent의 기술적 난점(문맥 처리, Latency, STT 요구사항)과 온프레미스 Whisper 서빙 방안(L4 GPU 기준 10 채널)을 논의함. 일본 시장 진출 시 경쟁사(PKSHA, AmiVoice, tl;dv) 분석과 한국 서비스에 대한 현지 편견, Salesforce 중심의 영업 환경, 그리고 PoC/Beta 단계의 긴 의사결정 주기를 확인함. 또한 노인 대상 콜봇의 epd_time 이슈 등 지엽적 기술 문제와 CRM(허브스팟) 연동 한계도 기록됨.

Key Points

  • Voice Agent 기술: LLM+STT+TTS 파이프라인에서 3초 지연(Latency) 발생, 대기음 사용 중. 온프레미스 Whisper 서빙 검토(GPU L4 기준 10 채널, 100~300ms).
  • 일본 시장 환경: 한국 서비스에 대한 부정적 편견 존재. Salesforce 기반 영업 프로세스 우세. 시장 규모는 한국의 2배 이상.
  • 경쟁사 동향: PKSHA, AmiVoice, tl;dv 등 일본 내 경쟁사 존재. 납품된 유휴 서버에 Whisper 서빙 적용 가능성 검토.
  • 프로젝트 현황: TMN 모델 유지 및 채널 수 관리 필요. 데이터 수집(500 건) 진행 중. 개인 정보 저장(utterance_save)은 현재 사용 불가.
  • 기술 이슈: 노인 대상 콜봇에서 제품번호 입력 시 epd_time 초과 문제 발생(max_utter_duration 조정 필요). CRM 연동 시 허브스팟 미지원.
  • 비즈니스 사이클: 대기업 AI Agent 도입 시 PoC 및 Beta 기간 각각 3개월, 총 의사결정까지 6개월 이상 소요.