리팩토링 시도: cdrewrite 및 transducer 기반 태그 삽입 성능 문제

Source

  • Field Notes/ReturnZero/Daily Notes/Day 474. 2022-10-17.md

Summary

리팩토링 과정에서 cdrewrite와 transducer를 이용해 태그 삽입 및 블랙리스트 처리를 시도했으나, 기존 방식 대비 초기화 시간이 약 9배 증가하는 심각한 성능 저하가 발생했다. 또한 rewriter들을 compose로 합치려 했으나 오류가 발생하여 실패했다. 현재는 리스트로 저장해 순차적으로 실행하는 방식과 compose 방식의 성능/동작 차이를 비교 분석 중이며, ‘해보세요’ 류의 어미 처리 등 규칙 기반 하이라이팅의 정확도와 속도 트레이드오프를 고민하고 있다.

Key Points

  • cdrewrite/transducer 도입 시 초기화 시간 4초 → 15.5초로 증가 (약 9배 느려짐)
  • rewriter compose 시도 실패 (오류 발생)
  • 기존 방식: 리스트 기반 순차 실행, 빠른 초기화 (~4ms)
  • 신규 방식: 태그 삽입(, 등)은 성공하나 성능 병목 발생
  • 추후 작업: compose vs top_rewrite 방식 비교, ‘해보세요’ 류 어미 규칙 검증