Online Estimation of Evolving Human Visual Interest
Source
Evernote/Inbox/Online Estimation of Evolving Human Visual Interest.md
Summary
이 논문은 비디오 스트림에서 인간의 시각적 관심사(ROIs)를 예측하기 위한 ‘인간-인-더-루프(human-in-the-loop)’ 상호작용 프레임워크를 제안합니다. 눈동자 추적 데이터와 비디오 콘텐츠를 결합하여, 갑작스러운 눈 움직임으로 인한 시간적 불연속성, 노이즈, 행동적 아티팩트 등을 고려한 시각적 주의 모델을 구축합니다. 이를 통해 아직 보지 못한 프레임의 시각적 돌출도(saliency)를 예측하며, 비디오 리타겟팅(화면 비율 조정 시 정보 보존) 및 스마트 자막 삽입 등 응용 분야에 활용 가능합니다.
Key Points
- 비디오 내 인간 시각적 관심 영역(ROIs) 예측을 위한 상호작용 프레임워크 제안
- 눈동자 추적(Eye tracking)과 비디오 콘텐츠 기반의 시각적 주의 모델링
- 갑작스러운 눈 움직임, 노이즈, 행동적 아티팩트 등 눈동자 추적 특성의 시간적 불연속성 고려
- 미관측 프레임에 대한 시각적 돌출도(Visual Saliency) 예측
- 응용 분야: 정보 보존형 비디오 리타겟팅, 스마트 자막(Closed-caption) 삽입
Related
-
A Prediction-Based User Selection Framework for Heterogeneous Mobile CrowdSensing
-
Egocentric Field-of-View Localization Using First-Person Point-of-View Devices
-
Near-duplicate video retrieval: Current research and future trends
-
웹 페이지의 시각적 복잡성 측정 (Measuring the Visual Complexities of Web Pages)
-
Robust and accurate mobile visual localization and its applications
-
Efficient Estimation of Word Representations in Vector Space
-
People reidentification in surveillance and forensics: A survey
-
지오태그 이미지로부터 장면 위치 식별 (Identification of scene locations from geotagged images)
-
Coordinated Multi-Device Presentations: Ambient-Audio Identification
-
Intel Research: Context Awareness - Social Proximity Detection
-
3DNN: Viewpoint Invariant 3D Geometry Matching for Scene Understanding
-
웹캠의 지리적 통합 및 보정 (Web-accessible geographic integration and calibration of webcams)
-
Dynamic Time Warping for Music Conducting Gestures Evaluation