3i4k 모델 성능 저하 분석 및 Pronaia 클라이언트 개발 현황

Source

  • Field Notes/ReturnZero/Daily Notes/Day 350. 2022-06-15.md

Summary

2022-06-15 일지. 3i4k 프로젝트에서 추출한 메트릭의 낮은 품질과 시간 낭비에 대한 자책. 질문/비질문 분류 모델의 FP(False Positive) 과다 문제 확인 및 결과 저장 로직 수정. Pronaia STT API 클라이언트(VITOOpenAPIClient)의 gRPC/WebSocket 래퍼 구현 및 protobuf 버전 관리 작업. 투자 유치(23년 6월)를 위한 6개월 내 기술적 브레이크스루 필요성 인지.

Key Points

  • 3i4k 데이터 분석: 질문/비질문 분류 모델의 Accuracy는 높으나 Precision/Recall/F1이 낮고 FP가 과다함. best prediction 저장 및 피클링 로직 수정에 4시간 소요.
  • Pronaia 클라이언트 개발: VITOOpenAPIClient 구현 중. HTTP, gRPC, WebSocket 기반 전사 API 래퍼 작성 및 protobuf/grpc 버전 호환성 작업 진행.
  • 프로젝트 로드맵: 2023년 6월 투자 유치를 위해 2022년 말까지 기술적 브레이크스루 필요. 현재 투자 시장 악화로 성과의 질이 중요시됨.
  • 참고 자료: 한국어 화자 의도 식별 관련 논문(Text Implicates Prosodic Ambiguity) 및 TensorFlowKR 포럼 참고.