미팅 요약 서베이 및 화행 분석

Source

  • Field Notes/ReturnZero/Daily Notes/Day 415. 2022-08-19.md

Summary

본 노트는 미팅 요약의 I-T-G(해석-전환-생성) 파이프라인 중 ‘해석(Interpretation)’ 단계에 초점을 맞춘 서베이 기록이다. 발화 내용뿐만 아니라 화자, 청자, 상황 등 맥락 정보, 특히 ‘화행(Dialogue Acts)’ 정보가 요약의 정확성에 중요함을 강조한다. DAMSL, DiAML 등 기존 화행 어노테이션 스키마의 한계(담화 구조의 얕은 표현, 전문성 요구)를 지적하며, 화행 라벨을 활용한 문장 기반 요약 모델(LSTM 기반)의 가능성을 탐색한다. 또한 SAC 모델 기획을 위해 일정, 금액, 업계 용어(RFP 등) 등 도메인 특화 키워드 추출과 평가형 표현 라벨링의 필요성을 논의한다.

Key Points

  • 미팅 요약은 Interpretation(해석), Transformation(전환), Generation(생성)의 3단계로 구성되며, 현재는 해석 단계의 성공을 우선 목표로 함.
  • 발화 자체보다 화행(Dialogue Acts) 및 담화 맥락 정보가 요약에 중요하나, 전사록에 명시적으로 남지 않아 어노테이션이 필요함.
  • 기존 화행 스키마(DAMSL, DiAML)는 담화 구조를 얕게 표현하며 언어학적 전문성이 요구됨. 자동 어노테이션 시 불확실성 문제가 존재함.
  • 화행 라벨을 인코더-디코더 구조(LSTM)에 통합하여 요약 품질을 높이는 문장 기반 메커니즘 연구가 진행 중임.
  • SAC 모델 기획을 위해 일정, 금액, 업계 용어(스펙, 견적, RFP), 주요 요청 표현 등을 도메인 특화 키워드로 추출하고 평가형 표현을 라벨링할 계획임.