-
Deep Learning - 1machine learning 2020. 12. 10. 10:57
인턴 생활을 하며 배웠던 딥러닝에 대해 정리해 보려고 한다.
외관 손상 인식 공부
Mask R-CNN Mask R-CNN은 Faster R-CNN에 각 픽셀이 객체인지 아닌지 masking하는 CNN을 추가
- 객체가 있을 만한 영역 탐지
- 탐지한 영역 내 어떠한 범주가 있을지 예측
- 탐지한 영역 내 픽셀이 위에서 예측한 객체인지 아닌지 예측
U-Net (Semantic Segmentation Task에 널리 쓰이는 모델 중 하나)
기존 Segmentation 모델의 문제점 해결 가능
이미지를 인식하는 단위에 대한 overlap 비율이 적기 때문에 빠른 속도를 낼 수 있음
patch에서 검증이 끝난 부분을 중복 검증하지 않기 때문
Semantic Segmentation
- Instance Seg: 분할의 기본 단위를 사물로 설정 → 같은 의자가 여러개 있으면 모두 다른 클래스로 판단
- Semantic Seg: 분할의 기본 단위를 클래스로 설정 → 같은 의자가 여러개 있어도 하나의 클래스로 판단
- 따라서 파손 정도를 파악하기 위해서 → 서로 떨어져 있는 파손 영역이라도 동일한 파손이라면 같은 클래스에 들어가야 하기 때문에 Semantic Segmentation이 적절 파손의 종류는 스크래치, 찌그러짐, 이격 3종류로 나뉨
- 학습을 거쳐 출력되는 이미지는 3장의 2차원 이미지. 이 3장의 이미지는 각각 스크래치, 찌그러짐, 이격. 예측 마스크의 각 픽셀은 대응되는 입력이미지의 픽셀이 해당 파손 클래스에 속할확률을 가지고 있음. 이 마스크를 CRF방식과 Thresholding 방식으로 binary mask로 변환함 스크래치와 이격의 경우 세밀한 경계설정이 필요하기 때문에 CRF방식 찌그러짐은 면적이 큰 경우가 대부분 이기 때문에 Thresholding 방식
'machine learning' 카테고리의 다른 글
Deep Learning - 6 (0) 2020.12.11 Deep Learning - 5 (0) 2020.12.10 Deep Learning - 4 (0) 2020.12.10 Deep Learning - 3 (0) 2020.12.10 Deep Learning - 2 (0) 2020.12.10