인공지능 수업 과제

<실험 설정>

ResNet-50 : 50개의 레이어로 구성되며 잔여 연결(residual connection)을 사용
- 아키텍처: 합성곱 레이어 ➡️ 잔여 블록 ➡️ 전역 평균 풀링 ➡️ 완전 연결 레이어
- 각 잔여 블록은 2개 또는 3개의 합성곱 레이어와 숏컷 연결(shortcut connection)을 포함
- 활성화 함수: ReLU
- 각 합성곱 레이어 후에 배치 정규화를 적용
ResNext-50 : ResNet50과 유사하지만 그룹 컨볼루션(group convolution)을 적용
- 잔여 블록 내 각 합성곱 레이어를 그룹으로 나눔
- 그룹의 개수는 네트워크의 카디널리티(cardinality)를 결정
- 활성화 함수, 배치 정규화 및 기타 세부 정보는 ResNet-50과 동일 동일한 모델 세부 정보와 하이퍼파라미터 설정을 사용하여 ResNet-50과 ResNext-50의 성능을 비교함으로써 그룹 컨볼루션의 영향을 분석하고자 한다. ResNet50는 그룹 컨볼루션을 사용하지 않는 기준 모델로 작용하며, ResNext50은 그룹 컨볼루션 적용의 효과를 확인한다.

Learning rate	Epoch	Batch size	Model depth	Types of optimizer
0.01	100	64	50	SGD

Model	FLOPs	#parameters	Accuracy(Top-1)	Accuracy(Top-5)
ResNet	4.04 G	23.52M	88.79%	99.79%
ResNext	4.18 G	22.99M	89.99%	99.85%

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
ResNet_50.ipynb		ResNet_50.ipynb
ResNext.ipynb		ResNext.ipynb