생성형 AI 개론: 판별에서 생성으로, 잠재공간과 매니폴드

Source

  • Evernote/Inbox/생성형 AI에 대해 알아보자 - 1. 개론 - Ai 언어모델 로컬 채널.md

Summary

본문은 David Foster의 ‘Generative Deep Learning’을 기반으로 생성형 AI의 기본 개념을 설명한다. 기존 AI가 이미지 분류나 음성 인식 등 ‘판별(Discrimination)‘에 중점을 두었다면, 최근 생성형 AI는 ‘창작(Generation)‘으로 영역을 확장했다. 생성의 핵심 원리는 단순한 데이터 복제가 아닌, 학습 데이터를 통해 추출된 다양한 특질(Feature)을 벡터화하여 ‘잠재공간(Latent Space)‘에 매핑하는 과정이다. 이 공간에서 데이터는 유사한 특성을 가진 것끼리 모여 매끄럽게 연결된 구조인 ‘매니폴드(Manifold)‘를 형성한다(매니폴드 가설). 생성 AI는 이 잠재공간 내에서 확률적으로 점을 샘플링하거나 재조합하여 새로운 데이터를 디코딩하는 방식으로 작동하며, 이는 데이터의 패턴과 공통점을 학습한 결과로 볼 수 있다.

Key Points

  • 기존 AI는 판별(분류, 인식) 중심이었으나, 생성형 AI는 창작(생성) 기능으로 진화함
  • 생성 AI의 핵심은 ‘확률과 재조합이 포함된 검색’이며, 원본 데이터를 그대로 저장하지 않음
  • 학습 과정에서 데이터의 특질(Feature)을 추출하여 벡터화하고 잠재공간(Latent Space)에 배치함
  • 잠재공간 내 데이터 분포는 유사한 것끼리 모여 매끄럽게 연결된 ‘매니폴드(Manifold)’ 구조를 형성함
  • 생성 과정은 매니폴드 상에서 점을 샘플링하거나 재조합하여 새로운 데이터를 디코딩하는 방식임
  • 모델은 구체적인 데이터가 아닌 데이터셋의 분해된 특질과 공통점을 학습하여 압축된 형태로 지식을 보유함