신경망과 딥러닝 1. 퍼셉트론
Source
Evernote/Inbox/신경망과 딥러닝 1.퍼셉트론.md
Summary
본문은 딥러닝의 기초인 퍼셉트론(Perceptron)의 구조와 동작 원리를 설명한다. 퍼셉트론은 Frank Rosenblatt이 개발한 인공 뉴런 모델로, 다중 이진 입력에 가중치(weights)를 곱한 합이 임계값(threshold) 또는 편향(bias)을 넘을 경우 1, 그렇지 않으면 0을 출력하는 이진 분류기이다. 단일 퍼셉트론의 한계를 극복하기 위해 여러 퍼셉트론을 층(layer)으로 연결하면 더 추상적이고 복잡한 결정을 내릴 수 있음을 설명한다. 또한, 임계값을 편향(bias)으로 변환하여 수식을 단순화하는 과정을 다룬다. 후반부에서는 신경망 학습을 위한 MNIST 데이터셋(28x28 픽셀, 784 차원 벡터)과 비용 함수(cost function)의 필요성을 언급하며 학습 알고리즘 도입을 준비한다.
Key Points
- 퍼셉트론은 다중 이진 입력을 가중치 합산 후 임계값과 비교하여 이진 출력(0 또는 1)을 생성하는 모델이다.
- 가중치(weights)는 입력의 중요도를, 임계값(threshold) 또는 편향(bias)은 출력 활성화의 기준을 결정한다.
- 단일 퍼셉트론은 단순 결정에 적합하나, 다층 구조로 연결하면 복잡한 추상적 결정을 수행할 수 있다.
- 임계값은 수식상 편향(bias)으로 변환되어 표현되며, 이는 뉴런의 활성화 용이성을 조절한다.
- 신경망 학습은 MNIST와 같은 데이터셋을 사용하여 입력(784 차원)과 목표 출력(10 차원) 간의 오차를 최소화하는 가중치와 편향을 찾는 과정이다.