Paper review
-
[NLP] Attention Is All You Need 번역 및 정리 (Transformer)Paper review/NLP 2021. 12. 6. 01:25
@ 굵은 글씨는 중요한 내용, 빨간 글씨는 내가 추가한 내용 https://arxiv.org/pdf/1706.03762.pdf 주요 기여: RNN을 제거함으로써 병렬처리를 가능하게 함 Transformer 제안 0. Abstract 보통의 sequence transduction model들은 인코더와 디코더를 포함하는 rnn 혹은 cnn을 기반으로 하거나 SOTA 모델은 attention 메커니즘을 통해 인코더와 디코더를 연결한다. 우리는 rnn과 cnn을 완전 배제하고 attention 메커니즘만을 사용하는 단순한 아키텍쳐인 transformer를 제안한다. 실험 결과, 우리 모델이 병렬화가 훨씬 용이하고 학습 시간이 훨씬 더 적지만 성능은 높다는 것을 보인다 (28.4 BLEU on the WMT 2..
-
[Object detection] YOLO9000:Better, Faster, Stronger 번역 및 정리 (YOLOv2)Paper review/Object Detection 2021. 11. 22. 15:39
@ 굵은 글씨는 중요한 내용, 빨간 글씨는 내가 추가한 내용 https://arxiv.org/pdf/1612.08242.pdf 주요 기여: YOLO를 보완하여 정확도와 속도를 높인 YOLOv2 제안 9000 카테고리를 구분할 수 있는 YOLO9000 제안 (기존 detection dataset인 coco는 80 class) 0. Abstract 기존 YOLO에 대한 다양한 개선을 제안한 YOLOv2는 속도 및 성능 측면에서 모두 SOTA를 달성한다 (67fps에서 76.8mAP, 40fps에서 78.6mAP). object detection 및 classification에서 jointly train 방법을 제안한다. COCO dataset과 ImageNet dataset을 동시에 학습한다. 이를 통해 l..
-
[Classification] An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale 번역 및 정리 (ViT)Paper review/Classification 2021. 11. 8. 21:04
@ 굵은 글씨는 중요한 내용, 빨간 글씨는 내가 추가한 내용 https://arxiv.org/pdf/2010.11929.pdf 주요 기여: Standard Transformer를 vision task에 적용 (CNN 구조 대부분을 제거) large dataset에서 사전학습된 네트워크를 transfer learning하여 small image dataset에서 학습 가능 0. Abstract Transformer가 NLP에서는 표준이 되었지만 computer vision task에서는 제한적이다. 기존의 vision task에서 attention은 CNN과 함께 적용되거나, CNN의 특정 요소를 대체하기 위해 사용된다. (EX. DETR은 CNN으로 feature map 획득 후 transformer 수..
-
[Computer Vision] Learning Deep Features for Discriminative Localization 번역 및 정리 (CAM)Paper review/Computer Vision 2021. 11. 5. 18:04
@ 굵은 글씨는 중요한 내용, 빨간 글씨는 내가 추가한 내용 http://cnnlocalization.csail.mit.edu/Zhou_Learning_Deep_Features_CVPR_2016_paper.pdf 주요 기여: GAP(global average pooling)을 통해 object localization을 수행하고 성능을 높임 0. Abstract 우리는 다양한 실험에서 우리의 네트워크가 분류 과제를 해결하기 위한 훈련을 받았음에도 불구하고 차별적 이미지 영역을 국소화 할 수 있다는 것을 입증한다. 본 연구는 GAP를 통해 CNN이 image 학습 후에(classification이 어떻게 결정되는지 주목하는 위치에 대한 정보가 없는 label만을 학습) localization 능력을 가질 수..
-
[Document Enhancement] BEDSR-Net: A Deep Shadow Removal Network From a Single Document Image 번역 및 정리 (BEDSR-Net)Paper review/Document Enhancement 2021. 11. 4. 17:21
@ 굵은 글씨는 중요한 내용, 빨간 글씨는 내가 추가한 내용 https://arxiv.org/pdf/2010.04159.pdf 주요 기여: 최초로 딥러닝을 문서 shadow 제거 알고리즘에 적용 문서 shadow dataset 구축 0. Abstract 대부분의 기존 문서 이미지 shadow 제거 알고리즘은 hand-crafted heuristics이며 특징이 다른 문서에 강건하지 않다. 본 논문은 문서 이미지 shadow 제거를 위한 Background Estimation Document Shadow Removal Network (BEDSR-Net)를 제안한다. Background estimation module(BE-Net)은 문서의 global 배경색을 추출하기 위해 설계되었다. 배경색을 추정하는 ..
-
[Object detection] End-to-End Object Detection with Transformers 번역 및 정리 (DETR)Paper review/Object Detection 2021. 11. 3. 13:55
@ 굵은 글씨는 중요한 내용, 빨간 글씨는 내가 추가한 내용 https://arxiv.org/pdf/2005.12872.pdf 주요 기여: 기존의 object detectino에 비해 간단하고 좋은 성능 DETR 제안: 이분 매칭 손실 함수 + Transformer 적용 0. Abstract 본 논문은 Object detection을 set prediction 문제로 다룸으로써 NMS(non-maximum suppression)이나 anchor generation과 같은 사전 지식 요소를 제거하여 pipeline을 간소화한다. Set prediction은 수학에서의 집합의 의미와 비슷하다. Set은 중복되지 않고 순서에 상관없다는 특징을 활용하여 휴리스틱한 NMS나 anchor와 같은 사전 지식을 제거한..
-
[Object Detection] Rich feature hierarchies for accurate object detection and semantic segmentation 번역 및 정리 (R-CNN)Paper review/Object Detection 2021. 8. 3. 01:11
https://arxiv.org/pdf/1311.2524.pdf 주요 기여: Object detection 분야에 첫 CNN 적용. 30%이상 성능 향상 0. Abstract 본 논문은 53.3%의 mAP 달성 object detection 알고리즘을 제안한다. 두 가지 핵심 insight는 다음과 같다. object를 localize하고 segment하기 위해 high-capacity convolutional neural networks (CNNs) 적용. labeing train data가 부족한 경우, auxiliary task에 대한 supervised pre-training과 domain-specific fine-tuning으로 성능 향상. Region Proposal을 CNN과 결합하여 R-C..
-
[Player Tracking] A Computer Vision driven Squash Players Tracking System 논문 리뷰Paper review/Player Tracking 2021. 7. 27. 20:44
https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=8379085 주요 기여: - 전체적인 sports 경기 분석 방법론 제안. - localization 및 tracking 인터페이스 개발. 0. Abstract 본 논문은 squash player를 tracking 하여 경기력을 분석하여 경기력 개선 방향을 탐색할 수 있는 기회를 제공하는 비디오 분석 시스템 제안. 이미지 처리를 통해 player의 위치 파악 및 추적 후 궤적 파악. 3. Methodology 1. squash 경기를 비디오로 캡처 2. 매치 완료 후 무선 통신을 통해 local 컴퓨터 혹은 서버로 전송 3. 경기 영상을 프레임으로 변환 4. 변환된 영상에 이미지 처리 알고리즘을 적용하여 pl..