Hypernetwork 구조 분석 및 한계점

Source

  • Ancom Workbench/Research/AI/Hypernetwork에 대해서.md

Summary

Hypernetwork는 Cross Attention Layer의 입력을 변형하는 단순한 전처리 레이어로, 구조적 한계로 인해 대량의 이미지 학습보다는 정교한 태그 라벨링이 더 효과적입니다. 프롬프트 길이 증가나 단순한 레이어 인젝션은 정보 전달 한계를 극복하지 못하며, 모델 구조를 확장하려면 코드 수정이 필요합니다.

Key Points

  • Hypernetwork는 Cross Attention 입력값을 변형하는 단순한 전처리 레이어이며, 과학습 방지를 위해 과도한 학습은 불필요함
  • 단순한 모듈 구조상 일반화 능력에 한계가 있어, 다량의 이미지 학습보다 소수 정교한 태그 라벨링이 더 효과적임
  • 프롬프트 길이 증가나 레이어 인젝션은 정보 전달 한계를 해결하지 못하며, 학습되지 않은 데이터는 처리 불가함
  • 기본 2층 구조를 다층 구조로 확장하려면 PyTorch 모듈 코드의 하드코딩 부분을 수정해야 함