WFST 인터페이스 및 파인튜닝 진행 상황 (Day 383)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 383. 2022-07-18.md

Summary

WFST(Weighted Finite State Transducer) 인터페이스 개선 및 규칙 검토를 진행 중이며, 3i4k 모델에 대한 파인튜닝 전략을 수립하고 있다. 데이터 처리 파이프라인(데이터프레임->CSV->스프레드시트)과 블랙리스트 태깅 방식을 논의했으며, 그래프 객체 생성 시 카테고리 기반 파일 매핑 방식을 제안했다. E2E 학습 코드 재활용과 플레이그라운드 데이터셋 선정을 위한 작업이 진행 중이다.

Key Points

  • WFST 인터페이스 꾸미기 및 규칙 검토 진행
  • 3i4k 모델 파인튜닝 방법론 모색
  • 블랙리스트 데이터 태깅 및 비율 분석을 위한 데이터 파이프라인 구성
  • 그래프 객체 생성 시 카테고리 기반 TSV 파일 매핑 방식 제안
  • 기존 학습 코드 기반의 E2E 학습 및 플레이그라운드 데이터셋 선정