본문 바로가기

취업준비/인공지능

[AI Tech] 6주차 26-1차시 Computer Vision Applications

26차시: CNN - 2

26-1. Computer Vision Applications

1. Semantic Segmentation

자율주행, ADAS에서 많이 활용된다.

자율주행에서는 내 앞에 있는 것이 무엇인지 판단할 필요가 있다.

LiDAR를 사용하지 않을 때 이 기술을 잘 활용하는 것이 중요하다.

Fully Convolutional Network

CNN

This is how an ordinary CNN looks like.

Fully Convolutional Network

This is a fully convolutional network.

Dense layer를 없애는 과정을 convolutionalization이라고 한다.

convolution network와 파라미터가 정확히 일치한다.

비교

Number of parameters

(좌) 4 x 4 x 16 x 10 = 2,560

(우) 4 x 4 x 16 x 10 = 2,560

이 과정을 convolutionalization이라고 한다.

Convolutionalization을 하는 이유

1) Transforming fully connected layers into convolution layers enables a classification net to output a heat map.

Fully Convolutional Network

고양이가 어디에 있는지 위치가 나온다.

단순히 분류만 했던 것이 Heat Map의 가능성이 생겼다.

2) While FCN can run with inputs of any size, the output dimensions are typically reduced by subsampling.

So we need a way to connect the coarse output to the dense pixels.

subsampling

Deconvolution (conv transpose)

Spacial Demension을 키우게 된다.

다만, 엄밀히 따지면 convolution의 역연산은 없다.

이렇게 생각하면 좋은 이유는 크기 계산이 용이해지기 때문이다.

Conv vs. Deconv

Results

결과

 

2. Detection

R-CNN

이미지 안에서 region을 뽑아내는 것

R-CNN

완벽하지 않지만 Detection 문제를 풀고자 했다.

SPPNet

SPPNet

Fast R-CNN

Fast R-CNN
처리 순서

Faster R-CNN

Faster R-CNN

Bounding Box를 뽑는 것도 학습을 시키자.

Region Proposal Network + R-CNN 이다.

Region Proposal Network

Region Proposal Network

bounding box를 얼마나 줄이거나 키울지, 쓸모가 있는지 없는지를 판단하는 것 = Region Proposal Network

YOLO

YOLO metods

그냥 이미지 한 장에서 뽑아내기 때문에 YOLO라고 한다.

YOLO

Bounding Box를 찾아내는 것과 class를 찾아내는 것에 용이하다.

 

 

 

 

 

©️Hackerrank. All Rights Reserved.