머신러닝에 대한 기본 용어
1. 머신러닝 모델의 구조
머신러닝은 일반적으로 입력층, 은닉층, 출력층으로 나뉜다.
- 입력층
모델에 입력되는 데이터를 의미한다. 입력데이터는 분석에 도움되는 특징들이 많이 있거나, 데이터의 양이 많을 수록 좋다.
- 은닉층
우리가 보지 못하는 기계의 역할을 하는 부분이다. 은닉층은 1층 이상으로 구성되는데, 일반적으로 은닉층이 많으면 시간이 오래걸리지만, 분석의 정확도는 높아진다. 은닉층에서는 웨이트(weight)와 바이오스(bias)라는 매개변수를 가지고 있다.
- 출력층
모델이 출력하는 결과를 의미한다.
2. 활성화 함수 activation
활성화 함수는 각 층에 각 뉴런에 계산된 값의 출력을 결정해주는 함수이다. 각 층마다 각각 지정해주기도 하고, 지정하지 않기도 한다. 주로 사용하는 활성화 함수는 relu 함수와 sigmoid 함수가 있다.
3. 은닉층의 뉴런의 수 neural
은닉층에서는 각 층마다 뉴런(neural)의 개수를 결정할 수 있다. 이때 뉴런의 개수가 많을수록 시간이 오래걸리지만, 많은 매개변수를 사용해 모델을 구성할 수 있다.
4. 오차 함수 loss
실제 데이터와 모델이 예측한 데이터의 오차를 어떤 수식에 따라서 계산할 것인가를 결정한다.
5. 최적화 함수 optimizer
오차 함수(loss)에서 결정된 오차 값을 어떻게 줄여나갈지 결정하는 함수이다.
6. 반복횟수 epoch
머신러닝의 모델의 구조에 따르면, 머신러닝은 입력데이터를 통해서 계산한 후, 오차를 출력한다. 반복횟수(epoch)는 이 행위를 몇 번 반복할지 결정한다.
7. 학습률 lr
학습률은 반복횟수(epoch)와 많은 관련이 있다. 머신러닝은 전에 발생했던 오차(loss)를 줄여나가는 방향으로 반복해야한다. 이때 전에 발생했던 오차(loss)를 다음 회차때 얼만큼의 비율을 반영할지에 대해 결정한다. 학습률(lr)의 단위는 확률로 되어있어 0~1의 값을 가진다.
수정
2021-10-28 단어수정 node -> neural, 노드 -> 뉴런