최락권 박사님 세미나: 영상 품질 평가(QA) 및 시각 인지 모델

Source

  • Field Notes/KAIST/MNLab/최락권 박사님 세미나.md

Summary

본 노트는 최락권 박사님의 세미나 내용을 바탕으로 영상 품질 평가(Quality Assessment, QA)의 현황과 한계를 다룬다. 전통적인 Full-Reference 방식(MSE, PSNR)이 인간의 시각적 인식과 괴리가 있음을 지적하며, 구조적 유사성(SSIM) 및 무참조(No-Reference) 방식(BRISQUE 등)의 필요성을 강조한다. 특히 자연 이미지 통계(MSCN)의 한계(인공 이미지, HDR, 안개 등)와 모션에 대한 인간의 노이즈 둔감성, 시각 신경의 수학적 모델(Gabor, Hubel)을 통한 주관적 품질 정량화 방향을 논의한다.

Key Points

  • 전통적 QA 알고리즘(MSE/PSNR)은 계산이 빠르나 인간 시각 인식과 괴리가 있음.
  • SSIM 은 명도, 대비, 구조의 3 가지 요소를 고려하여 MSE 의 한계를 보완함.
  • No-Reference QA 는 머신러닝 및 시각적 이미지 통계(BRISQUE, MSCN)를 활용하나, HDR, 인공 이미지, 안개(de-fogging) 상황에서는 적용에 한계가 있음.
  • 인간 시각은 모션 발생 시 노이즈에 둔감하며, 이를 반영한 인식 모델 개발이 필요함.
  • 시각 신경의 수학적 모델(Gabor, Hubel)과 통계 처리를 결합하여 주관적 품질을 정량화하는 것이 핵심 과제임.
  • 비디오 모션 지점을 메타데이터로 생성하는 ‘Victures’ 같은 도구도 언급됨.