2023-01-05 일지: pysommers 배포 문제 해결, NLP4STT 띄어쓰기 모델 최적화 및 사업계획

Source

  • Field Notes/ReturnZero/Daily Notes/Day 554. 2023-01-05.md

Summary

이 노트는 2023년 1월 5일의 작업 일지로, 크게 세 가지 영역을 다룹니다. 첫째, pysommers 패키지의 compute_ter_with_range() 함수 마무리 및 배포 과정에서 발생한 Python 환경(pip/python 버전 불일치) 문제를 get_pip.py를 통해 해결한 기술적 기록입니다. 둘째, NLP4STT 프로젝트의 띄어쓰기 모델 학습 데이터 정제 방향성(통계적 오류 학습 배제)과 PyTorch/Lightning 모델을 ONNX 및 TensorRT로 변환하여 추론 성능을 최적화하기 위한 기술 스택 검토(Torch -> ORT -> TRT 파이프라인)를 담고 있습니다. 셋째, Callabo 사업의 2023년 목표(유료기업 5곳 또는 WAU 1000)와 3Q 마일스톤, 투자 유치 타이밍(6~7월)에 대한 전략적 고려사항을 기록하고 있습니다.

Key Points

  • pysommers 배포 시 Python 환경 꼬임(pip vs python 경로 불일치) 발생, get_pip.py 재설치로 해결
  • NLP4STT 띄어쓰기 모델: 학습 데이터에서 ‘이중허용’ 오류 학습을 배제하고 명확한 띄어쓰기만 인정하는 방향으로 데이터 정제方針 변경
  • 모델 최적화 파이프라인: PyTorch(Lightning) -> ONNX -> TensorRT(TRT) 변환을 통한 추론 가속화 검토
  • Callabo 2023 목표: 반기 내 유료기업 5곳 확보 또는 WAU 1000 달성, 3Q 마일스톤 집중
  • 투자 유치 전략: 6~7월을 핵심 투자 유치 시기로 설정, 사업 성과 가시화 후 진행 계획