Task Trail: 사용자 검색 행동의 효과적인 세분화

Source

  • Evernote/Inbox/Task Trail An Effective Segmentation of User Search Behavior.md

Summary

이 논문은 웹 검색 로그 분석을 위해 ‘Task Trail(작업 추적)’ 개념을 제안한다. 기존 세션(Session)이나 쿼리(Query) 단위 분석의 한계를 넘어, 사용자의 원자적 정보 필요(Atomic Information Need)를 하나의 ‘작업’으로 정의하고 해당 작업 내 모든 활동(쿼리 수정, 클릭 등)을 추적한다. 대규모 상업용 검색 엔진 데이터를 활용한 실험 결과, Task Trail은 세션/쿼리 단위보다 사용자 만족도 판정 및 검색 관심 예측에서 더 우수한 성능을 보였으며, 쿼리 제안(Query Suggestion) 시스템에서도 세션 기반 접근법의 좋은 보완재로 작용함을 확인했다.

Key Points

  • 정의: ‘Task’는 사용자의 원자적 정보 필요를 의미하며, ‘Task Trail’은 해당 작업 내 모든 사용자 활동(쿼리 재구성, URL 클릭 등)을 포괄한다.
  • 기존 연구 대비 차별점: 기존 연구가 세션 또는 쿼리 수준에서 분석한 것과 달리, 단일 세션 내 여러 작업이나 단일 작업 내 여러 쿼리를 명확히 구분하여 분석한다.
  • 실험 결과 1 (만족도 판정): Task Trail은 세션 및 쿼리 Trail 대비 사용자 만족도 판정 정확도가 더 높다.
  • 실험 결과 2 (웹페이지 유틸리티): Task Trail 기반 분석은 최종 사용자의 웹페이지 유틸리티를 세션/쿼리 기반보다 높인다.
  • 실험 결과 3 (랭킹 함수 측정): Task Trail은 쿼리 Trail과 유사하지만 세션 Trail보다 다양한 랭킹 함수 측정에 더 민감하다.
  • 실험 결과 4 (주제 일관성): 동일 Task 내 쿼리 용어는 서로 다른 Task 간 쿼리 용어보다 주제적 일관성이 더 높다.
  • 실험 결과 5 (쿼리 제안): Task Trail 기반 쿼리 제안은 세션 Trail 및 클릭-스루 이분 그래프 기반 제안의 효과적인 보완재이다.