2024-11-28 업무 및 실험 기록

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1247. 2024-11-28.md

Summary

이 노트는 2024 년 11 월 28 일의 업무 일지 및 기술적 실험 기록을 담고 있습니다. 주요 내용은 일본어 음성 인식 (ASR) 모델의 성능 최적화 실험으로, 키워드 부스팅 (boosting) 가중치 조정, 띄어쓰기 처리, 그리고 특정 시간 표현 (시경, 頃 등) 에 대한 후처리 규칙 변경이 Character Error Rate(CER) 에 미치는 영향을 반복적으로 테스트한 과정입니다. 또한 LLM 학습용 Liger kernel 도입 검토, Pronaia 엔진 관련 코드 리팩토링 (Transcriber 명칭 변경, 큐 구조 조정), 그리고 SGLang 기반 추론 속도에 대한 벤치마킹 결과 (3090 GPU 기준 발화당 약 1 초대) 가 기록되어 있습니다.

Key Points

  • 일본어 ASR 모델의 CER 개선을 위한 하이퍼파라미터 튜닝 (부스팅 가중치 1.5~1.8 범위 테스트, 띄어쓰기 유무 비교)
  • 특정 토큰 (時, 頃, ご) 의 오인식 문제를 해결하기 위한 사전/사후 처리 규칙 수정 및 그 효과 분석
  • Pronaia 프로젝트의 코드 구조 개선: Arthur 브랜치 분기, Worker(RMQ) 유지, Reader 및 큐 이름 추가, Transcriber 관련 요소 명칭 통일
  • LLM 추론 성능 평가: SGLang + LLaMA-Factory 환경에서 RTX 3090 기준 발화당 약 1 초대 추론 속도 확인, 2B 모델 다운사이징 또는 프롬프트 간소화 필요성 제기
  • 신한카드 PII 처리 및 Triton 프로파일링 계획 수립