Beyond Text QA: Multimedia Answer Generation by Harvesting Web Information

Source

  • Evernote/Papers/Beyond Text QA Multimedia Answer Generation by Harvesting Web Information.md

Summary

기존 커뮤니티 질문 답변(cQA) 서비스는 텍스트 답변만 제공하여 정보 부족 문제가 있다. 본 논문은 텍스트 답변을 웹에서 수집한 멀티미디어 데이터(이미지, 비디오 등)로 보강하는 방안을 제안한다. 시스템은 답변 매체 선택, 멀티미디어 검색 쿼리 생성, 데이터 선택 및 제시의 세 구성 요소로 이루어져 있으며, 텍스트 답변에 적합한 미디어를 자동으로 결정하고 웹에서 데이터를 수집한다. 직접적인 멀티미디어 답변 생성이 아닌, 커뮤니티 기여 텍스트 답변을 기반으로 하므로 더 복잡한 질문에 대응할 수 있으며, 다중 소스 QA 데이터셋 실험을 통해 유효성을 입증했다.

Key Points

  • 기존 cQA 서비스의 텍스트 중심 답변 한계 해결을 위해 멀티미디어 데이터 보강 방안 제안
  • 답변 매체 선택, 검색 쿼리 생성, 데이터 선택/제시 3단계 프로세스 구성
  • 직접적인 멀티미디어 답변 생성이 아닌, 기존 텍스트 답변을 기반으로 미디어 추가하여 복잡한 질문 처리 가능
  • 다중 소스 QA 데이터셋을 통한 실험으로 접근법의 유효성 검증