개념
지도학습은 입력 데이터와 정답이 함께 주어진 상태에서 모델을 학습하는 방법이다. 모델은 입력과 정답의 관계를 배우고, 새로운 입력이 들어왔을 때 정답을 예측한다.
학습은 보통 훈련 데이터의 평균 손실을 최소화하는 파라미터를 찾는 과정이다.
대표 작업
분류는 입력을 정해진 클래스 중 하나로 나누는 문제이다. MNIST 숫자 이미지를 0부터 9까지 분류하거나, 이메일을 정상과 스팸으로 분류하는 작업이 있다.
회귀는 연속적인 값을 예측하는 문제이다. 예를 들어 공부 시간으로 시험 점수를 예측하거나, 주가 관련 특징으로 다음 가격을 예측하는 문제를 생각할 수 있다.
알고리즘 예
의사결정트리는 지도학습의 대표적인 분류 알고리즘이다. 랜덤 포레스트와 XGBoost는 의사결정트리를 확장한 강력한 방법이다. CNN도 이미지 분류에서 지도학습으로 많이 학습된다.