ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [Deep Learning] computer vision 개념 정리
    Deep Learning/이론 2022. 11. 12. 18:10
    반응형

    @ 개인적인 답변이므로 참고만 하시길 바랍니다.

     

    딥러닝 발달 이전에 사물을 Detect할 때 자주 사용하던 방법은 무엇인가요?

    ==>

     

    Fatser R-CNN의 장점과 단점은 무엇인가요?

    ==> 

     

    dlib은 무엇인가요?

    ==> opencv와 유사하게 이미지 처리 및 기계학습, 얼굴 인식 등을 할 수 있는 c++ 기반의 라이브러리 (얼굴 인식과 관련된 분야에서 매우 좋은 성능을 보임)

     

    YOLO의 장점과 단점은 무엇인가요?

    ==> 이미지 전체를 한번만 보고 예측할 수 있고, 하나의 통합된 모델로 구성되어 있다. 또한, 실시간으로 탐지할 수 있다는 장점이 있다. yolo v1~ 장단점 정리

     

    제일 좋아하는 Object Detection 알고리즘에 대해 설명하고 그 알고리즘의 장단점에 대해 알려주세요

    ==> 

    • 그 이후에 나온 더 좋은 알고리즘은 무엇인가요?
    • ==> 

     

    Average Pooling과 Max Pooling의 차이점은?

    ==> pooling은 feature map size를 줄임으로써 연산을 빠르게 함과 동시에 특징을 추출하는 과정이다. 그 중 average pooling은 특정 범위 안의 값의 평균을 활용하는 방법이고, max pooling은 특정 범위 안의 값의 최댓값을 활용하는 방법이다.

     

     

    Deep한 네트워크가 좋은 것일까요? 언제까지 좋을까요?

    ==> 

     

     

    Residual Network는 왜 잘될까요? Ensemble과 관련되어 있을까요?

    ==> 기존 모델에서는(ex.googlenet) 네트워크가 깊어짐에 따라 (=layer가 많아짐에 따라) gradient vanishing(=기울기 소실)문제가 발생한다. 이로인해 역전파가 제대로 수행되지 못한다는 한계점을 가진다. 이를 해결하기 위해 residual이 등장했고, 기울기 소실 문제를 해결함에 따라 성능이 향상되는 것을 확인할 수 있었다.

     

    CAM(Class Activation Map)은 무엇인가요?

    ==> CNN이 이미지를 특정 class라고 분류할 때, 어떤 영역에 의해 그러한 예측 결과를 얻게 되었는지를 시각화 하는 map

     

    Localization은 무엇일까요?

    ==> 특정 object가 이미지 혹은 영상 내에서 위치하는 영역을 탐지하는 것

     

    자율주행 자동차의 원리는 무엇일까요?

    ==> 

     

    Semantic Segmentation은 무엇인가요?

    ==> egmentation 종류로는 instance, sementic, panoptic segmentation이 있다. 그 중 sementic segmentation은 이미지 내에서 픽셀 단위로 클래스를 예측하는 작업이다. (instacne segmentation은 이미지 내에서 object의 클래스를 예측하고 추가로 임의의 ID를 부여하는 작업이다. 즉, 2개의 사람 object가 있으면 2개의 object라고 예측한다. // panoptic segmentation은 sementic segmentation과 instance segmentation의 결합 형태로 이미지 내의 모든 픽셀에 대해 클래스를 예측하고 임의의 ID를 부여하는 작업이다.)

     

    Visual Q&A는 무엇인가요?

    ==>

     

    Image Captioning은 무엇인가요?

    ==> 이미지에 대해 caption을 달아주는 작업이다. 즉, 이미지가 주어졌을 때, 해당 이미지를 설명하는 text를 생성하는 것이다. 

     

    Fully Connected Layer의 기능은 무엇인가요?

    ==>

     

    Neural Style은 어떻게 진행될까요?

    ==>

     

    CNN에 대해서 아는대로 얘기하라

    ==>

     

    CNN이 MLP보다 좋은 이유는?

    • 어떤 CNN의 파라미터 개수를 계산해 본다면?
    • 주어진 CNN과 똑같은 MLP를 만들 수 있나?
    • 풀링시에 만약 Max를 사용한다면 그 이유는?
    • 시퀀스 데이터에 CNN을 적용하는 것이 가능할까?

     

    input size가 다른 경우?

    ==> 1. transformation (crop, resize): 쉽게 조정할 수 있지만, 일부 정보를 잃거나 해상도가 떨어지게 될 수 있다.

    ==> 2. inherent network preperty (fully convolutional net, spatial pyramid pooling)

    반응형

    댓글

Designed by Tistory.