SetFit 제로샷 분류 실험 및 ReturnZero 현황 (Day 545)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 545. 2022-12-27.md

Summary

SetFit을 활용한 제로샷 분류 성능 비교 실험 결과와 ReturnZero의 자금/경영 위기를 기록한 일기. 한국어 Sentence Transformer 모델(ko-sroberta)과 다양한 Loss 함수(CosineSimilarity, MultipleNegativesRanking) 적용 시 정확도(Accuracy)가 0.3~0.37 수준으로 미미한 개선만 보임. 경영 측면에서는 투자 유치 실패로 ‘존폐의 기로’에 서 있으며, 잔여 자금 50억으로 1년 생존을 위한 목표 수립(구축형 비중 확대 등)을 논의함.

Key Points

  • SetFit 제로샷 분류 실험: 샘플 48개 기반 학습 시, 기본 모델 대비 klue-roberta 및 ko-sroberta 적용 시 정확도 0.30~0.37 수준으로 유의미한 상승 없음.
  • Loss 함수 비교: CosineSimilarityLoss와 MultipleNegativesRankingLoss 적용 시 성능 차이가 크지 않음.
  • 일본어 처리 검토: Mecab의 숫자 판단 한계 및 히라가나-한자 변환 문제점 확인.
  • ReturnZero 경영 위기: 연말 투자 유치 실패로 잔여 자금 50억, 1년 생존 목표 설정. 현재 적자 규모(87억) 대비 30억 수익 목표 수립.
  • 전략 방향: 구축형 사업 비중 확대를 통한 수익성 개선 필요성 제기.