라벨링 가이드라인 및 카테고리 정의 (Day 478)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 478. 2022-10-21.md

Summary

이 노트는 고객 상담 데이터 라벨링 작업의 진행 상황(Jin, Vex)과 함께, ‘질문(Question)’, ‘요청(Request)’, ‘약속/커밋먼트(Commitment)’ 등 주요 라벨의 경계 조건과 예외 사항을 논의한 기록이다. 특히 ‘어떻게’ 표현의 뉘앙스, 조건부 문장, 연락처 교환 관련 문장, 그리고 약한 커밋먼트(weak commitment)의 포함/제외 기준에 대한 팀 내 논의와 미해결 이슈(TODO)를 담고 있다.

Key Points

  • 라벨링 작업량: Jin(2,000개, 숙련 시 500~1,000개/일), Vex(1,000개)
  • 질문(Question) 라벨링 기준: ‘어떻게’ 표현은 의도(질문 vs 불만/의문)에 따라 구분 필요. ‘고객님’ 호칭은 질문에서 제외. 이미 완결된 사건은 제외.
  • 연락처 관련: 연락처 제공/요청 문장(‘메일 알려드릴게요’, ‘연락처 확인’)은 라벨링 대상에서 제외하는 것이 좋음.
  • 커밋먼트(Commitment) 구분: ‘알려드릴게요’, ‘알아볼게요’는 weak commitment로 분류. ‘확인해보겠다’는 포함. 짧은 시간 내 연락과의 구분 필요.
  • 요청(Request) 라벨링: ‘만들어주-’, ‘보내주-’, ‘설명해주-’, ‘알려주-’ 등 광범위한 요청 형태 포함.
  • 미해결 이슈: ‘혹시/어떻게’로 커버되지 않는 질문 케이스 존재. ‘claim’ 및 ‘회장님’ 등 특수 호칭/표현 처리 필요.