Qoo10 rtboost 구현 및 dadumi aligner 알고리즘 설계 고민

Source

  • Field Notes/ReturnZero/Daily Notes/Day 615. 2023-03-07.md

Summary

2023 년 3 월 7 일의 일기 형식 노트로, Qoo10 rtboost 작업 완료와 함께 ‘dadumi aligner’의 텍스트 정렬 알고리즘 설계 과정을 기록하고 있다. 특히 띄어쓰기 변화, 부분 일치, 단어 합병/분리 등 복잡한 텍스트 변형 케이스를 처리하기 위한 앵커 기반 매칭 로직과 레벤슈타인 거리 (Levenshtein distance) 활용 방안을 고민하고 있다. 또한 조직 내 구조조정 등 업무 환경의 불확실성에 대한 우려도 함께 언급된다.

Key Points

  • Qoo10 rtboost 작업 완료 및 정상화 (norm) 진행
  • dadumi aligner 설계: 텍스트 내 단어 변경, 띄어쓰기 변화, 부분 일치 케이스 처리 필요
  • 앵커 (변화 없는 부분) 기반 매칭 로직 구상 및 단어 합병/분리 케이스 분석
  • 레벤슈타인 거리 (Lev) 를 활용한 삽입/삭제/대치 감지 방안 모색
  • 조직 구조조정 등 업무 환경의 불확실성 및 장기 목표 (1000 일) 에 대한 의문