개념

AlexNet은 2012년 ImageNet 대회에서 뛰어난 성능을 보이며 딥러닝 붐을 촉발한 대표적인 CNN 모델이다.

의미

AlexNet은 1000개 클래스와 120만 장이 넘는 이미지에 대해 깊은 CNN을 학습했다. 기존 머신러닝 기반 이미지 분류보다 오류율을 크게 낮추었고, GPU 기반 학습이 대규모 이미지 처리에서 현실적으로 가능하다는 것을 보여주었다.

구조적 특징

AlexNet은 여러 컨볼루션 층과 풀링 층을 거쳐 Feature Map을 만들고, 이를 펼쳐 fully connected layer에 전달한다. 입력 픽셀 값이 여러 합성곱과 풀링을 거치며 더 추상적인 특징 값으로 요약된다.

1000개 클래스 분류에는 softmax 확률과 교차 엔트로피 손실을 사용할 수 있다.

영향

AlexNet은 컴퓨터 비전에서 자동 특징 추출의 중요성을 강하게 보여주었다. 사람이 직접 필터를 설계하는 방식에서 모델이 필터를 학습하는 방식으로 중심이 이동했다.