Deview 2023 1일차 키노트 및 세션 요약 (네이버, 쏘카, Clova OCR)

Source

  • Creative Writings/Experiences/Deview 2023 1일차.md

Summary

본 노트는 Deview 2023 1일차 세션 내용을 기록한 것으로, 네이버의 반응형 검색 추천 시스템, 쏘카의 Continual Learning 기반 AI 재학습 시스템, 그리고 Clova OCR의 End-to-End 모델 개선 사례를 다룹니다. 각 세션은 기존 방식의 한계(검색 의도 파악의 어려움, 재학습 비용 및 Catastrophic Forgetting, 2-stage OCR의 연산 비효율)를 지적하고, 그래프 기반 추천, OOD 검출 및 프롬프트 기반 학습, 단일 백본 기반 E2E 아키텍처 등 구체적인 기술적 해결책을 제시합니다.

Key Points

  • 네이버 검색: 사용자 클릭 로그 기반 ‘Intent Query’ 추출 및 그래프 기반 ‘Intent Walker’를 활용한 반응형 추천 시스템 구축. 작은 문제 정의(Narrow Down)부터 시작하는 개발 방법론 강조.
  • 쏘카 AI: 이미지 분류 모델의 효율적 재학습을 위한 Continual Learning 적용. OOD(Out-of-Distribution) 검출을 통한 데이터 격리, Cosine Similarity 기반 데이터 리트리버, 그리고 LPG(Lightweight-prompt learning generation)를 통한 Catastrophic Forgetting 완화 시도.
  • Clova OCR: 검출과 인식을 분리한 2-stage 방식의 한계를 극복하기 위해 단일 백본을 공유하는 End-to-End OCR 모델(DEER) 도입. Pseudo-labeling을 활용한 데이터 효율성 증대 및 인코더/디코더 경량화를 통한 추론 속도 개선.