대방 방문 작업 목록 및 기술적 이슈 (2023-08-16)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 777. 2023-08-16.md

Summary

이 노트는 2023 년 8 월 16 일 대방 방문 시 수행할 예정이었던 Kubernetes 운영 작업 (Triton/OpenAPI 파드 재시작 CronJob 설정 및 RBAC 권한 문제) 과 Qoo10 일본어 데이터 전처리 파이프라인 정리, 그리고 vito-worker 의 timestamp 반환 확인 및 M1 Mac 환경에서의 grpcio 설치 문제를 기록한 일일 작업 메모입니다.

Key Points

  • Kubernetes CronJob 수정: Triton 재시작 주기를 ‘매주 일요일 0 시’에서 ‘매일 4 시’로 변경하고, Openapi Online 에 대한 유사한 CronJob 추가 계획.
  • RBAC 권한 오류: Helm 업그레이드 시 ServiceAccount 가 deployment 리소스를 list 할 수 없어 Forbidden 에러 발생. Role/RoleBinding 설정 검토 필요.
  • Qoo10 데이터 전처리: normalize, 문장 부호 처리, ASR 기반 오디오 정렬 (dadumi 사용) 등 일본어 데이터 파이프라인 단계 정리.
  • vito-worker 디버깅: timestamp 반환 여부 확인을 위해 로컬 환경 (Redis, Neural ITN) 에서 worker 실행 시도.
  • 환경 이슈: M1 MacBook 에서 grpcio Python 패키지의 바이너리 설치 문제 발생.