개념
MNIST는 손글씨 숫자 이미지 데이터셋이다. 0부터 9까지의 숫자 이미지를 분류하는 문제에 자주 사용된다.
데이터 형태
각 이미지는 28 x 28 픽셀로 이루어져 있다. 이를 1차원으로 펼치면 784개의 픽셀 값을 가진 특징 벡터가 된다. 각 픽셀 값은 보통 0부터 255까지의 밝기 값이다.
x∈R28×28⟶vec(x)∈R784
분류 문제
MNIST는 지도학습의 분류 문제이다. 출력층은 0부터 9까지 총 10개의 클래스를 나타내야 한다. 실제 숫자가 2라면 모델은 2에 해당하는 출력이 높고 나머지는 낮게 나오도록 학습해야 한다.