Commitment FP: ‘있다가’ 류 및 NLP/STT 관련 고찰

Source

  • Field Notes/ReturnZero/Daily Notes/Day 484. 2022-10-27.md

Summary

이 노트는 ‘있다가’와 같은 미완성 표현을 포함하는 커밋먼트(약속/의사표명) 패턴 분석을 주요 주제로 한다. 또한 ASR(음성인식) 결과 개선을 위한 NLP 기술(스펠체커, 띄어쓰기 교정, 구어체-문어체 변환)의 적용 가능성과 프로젝트 우선순위(BERT 활용, 가성비)에 대한 고찰을 담고 있다. 마지막으로 ‘가능질문형’ 요청 패턴(예: ‘~되면 안 될까요’, ‘~드릴까요’)의 분류와 가이드라인 수립 필요성을 언급한다.

Key Points

  • 커밋먼트 FP(False Positive) 분석: ‘있다가’ 류의 미완성 표현 패턴 식별
  • NLP 전략: ASR 결과 개선을 위한 BERT 기반 스펠체커 및 띄어쓰기 교정 프로젝트의 가성비 강조
  • 기술 방향성: 순수 NLP와 ASR 개선 모델 개발의 상호보완적 발전 및 에너지 관리 필요성
  • 구어체 처리: Paraphrase 및 Generative LM을 활용한 구어체에서 문어체로의 변환 가이드라인 수립
  • 패턴 분류: ‘가능질문형’ 요청(예: ‘~되면 안 될까요’, ‘~드릴까요’)의 세분화 및 허용/불허 기준 정의