개념
회귀는 입력 데이터로부터 연속적인 값을 예측하는 지도학습 문제이다. 분류가 “어느 범주인가”를 맞히는 문제라면, 회귀는 “얼마인가”를 예측하는 문제이다.
선형 회귀는 입력 특징의 가중합으로 값을 예측한다.
대표적인 손실함수는 평균제곱오차이다.
예시
공부 시간으로 시험 점수를 예측하거나, 키와 몸무게의 관계를 예측하거나, 주가 관련 feature로 미래 수익률을 예측하는 문제가 회귀에 해당한다.
의사결정트리와 회귀
의사결정트리는 분류뿐 아니라 회귀에도 사용할 수 있다. 회귀 트리는 데이터를 비슷한 수치를 갖는 관측치끼리 나누고, 리프 노드에서 평균값 같은 예측값을 할당한다.