2025-09-09 업무: 일본어/현대캐피탈 배포 및 제로원 프로젝트 킥오프

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1532. 2025-09-09.md

Summary

본 노트는 2025 년 9 월 9 일의 주요 업무 진행 상황을 기록한 일일 노트입니다. 핵심 주제는 세 가지로 요약됩니다. 첫째, 일본어 배치 배포 준비 및 TMN 모델 훈련 중 메모리 이슈와 다중 GPU 설정 조정입니다. 둘째, 현대캐피탈 프로젝트의 0.4.0 버전 배포 준비 및 모델 파일 정리입니다. 셋째, ‘제로원 프로젝트’ 킥오프를 통한 TTS 텍스트 정규화 규칙 정의, 데이터 드리븐 접근 방식 합의, 및 평가 메트릭 설정입니다. 또한 인텔(웰컴저축은행) 및 신한은행 다국어 사업 관련 초기 논의 사항도 포함됩니다.

Key Points

  • 일본어 배치 배포: worker 테스트 지연, 샌박 테스트 및 프로덕션 레디 준비 중
  • 일본어 TMN 훈련: 10 만 스텝 시 19 일 소요로 2 만 스텝으로 조정 필요, convert-job 시스템 메모리 요구사항 확인 (28G)
  • SIMS 다중 GPU 설정: ddp_backend 및 update_freq 조정 방안 논의
  • 현대캐피탈 배포: 0.4.0 버전 준비, common-model-root 및 raw-model-root 구조 정리, triton 모델 레포지토리 구성
  • 제로원 프로젝트 킥오프: TTS 텍스트 정규화 규칙 (괄호, 이모티콘, 알파벳, 숫자 처리 등) 정의
  • 제로원 프로젝트 전략: 규칙 기반보다 데이터 드리븐 (GPT 활용) 방식 채택, 하이브리드 방식 배제 이유 설명
  • 제로원 프로젝트 평가: BLEU score (6-gram), TPS, 메모리 사용량을 주요 메트릭으로 설정
  • 신한은행 다국어 사업: 몽골어 등 독점 언어 영역 강조, ‘데이터 해자’ 구축 전략 논의
  • 인텔/웰컴저축은행: 10 월 시작 예정 STT+TTS 프로젝트, 예산 및 위치 정보 기록