NLP 모델 오류 패턴 분석 및 개선 방안 (2022-10-28)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 485. 2022-10-28.md

Summary

이 노트는 휴가 중 회의 참석을 통해 NLP 모델의 특정 오류 패턴을 분석하고 개선 방안을 논의한 내용입니다. 주요 이슈로는 대명사 의존성 문제, 전화번호 등 민감 정보 추출 실패, 부정형 문장 인식 실패, ‘apologize’ 클래스의 높은 False Positive(FP) 문제, 수사적 표현 처리, 그리고 composite 규칙에 블랙리스트 도입 필요성 등이 제기되었습니다.

Key Points

  • 대명사(‘그거’)만 포함된 질문은 제외해야 하며, 고유명사 추출 정확도 향상 필요
  • 전화번호 등 특정 엔티티 추출 실패 사례 확인
  • 부정형 문장(commitment) 인식 실패 및 ‘apologize’ 클래스의 FP 과다 문제 (gogo 모델 deprecate 고려)
  • 수사적 표현 처리 및 composite 규칙에 블랙리스트 도입 검토
  • assuming + request 조합 패턴 제외 논의