[카테고리:] Paper
Paper Review
[TPAMI2020] Deep High-Resolution Representation Learning for Visual Recognition
이번 리뷰는 TPAMI2020에 게재된 논문으로 저에게 상당히 충격을 준 논문입니다. 주제는 High Resolution 표현을 잘 살리는 backbone 네트워크이며 저같은 경우에는 Dense level prediction task를 주요…
[2021 ICML] What Makes for End-to-End Object Detection?
안녕하세요. 이번 주 X-review에서는 object detection 논문 중에 end-to-end learning을 가능하게 하는 요소가 무엇인지에 대해 분석한 논문에 대해서 소개해드리겠습니다. 해당 논문은 one-to-one 기반의 방법론들과 one-to-many…
[CVPR 2018] PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space
지난 PointNet 의 단점들을 보완한 point cloud 를 input으로 하는 더 발전된 형태의 network 인 PointNet++ 입니다. 실제로 point cloud 를 이용한 3D Detection 모델은…
Big Self-Supervised Models are Strong Semi-Supervised Learners
해당 논문은 NeurlPS’2020에 공개된 논문으로 FixMatch와 같이 발표되었다. 두 논문 모두 Google 에서 발표되었다. FixMatch는 CIFAR-10과 같은 작은 데이터셋에서 Semi-supervision의 새로운 모델의 가능성을 보였고, 해당…
[arXiv2021]TransFG: A Transformer Architecture for Fine-grained Recognition
이번 논문은 현재 Paper with code에서 Fine-grained classification에서 SOTA를 달성한 방법론입니다. 제목에서도 유추가 가능하다시피 Transformer를 기반으로 설계된 네트워크이며, 추가로 각 클래스간 차별성을 극대화하기 위해 Contrative…
[CVPR 2019] Wing Loss for Robust Facial Landmark Localisation with Convolutional Neural Networks
이번에도 Facial Landmark Localization 논문입니다. 새로운 Loss 함수를 제안한 논문으로, 기존에 리뷰한 논문과는 다른 2D 기반의 Landmark Localization 방법론입니다. Wing Loss for Robust Facial Landmark…
[NIPS 2017]Attention is All You Need (Part.1)
Before Review 오랜만에 리뷰입니다. 논문은 평소에 읽어보고 싶었기도 하면서 , 비디오 과제에서 사용하고 있는 Timesformer를 이해하기 위해 Transformer의 원조 논문을 읽어보게 됐습니다. Transformer 자체가 자연어처리를…
[CVPR2021] Boosting Monocular Depth Estimation to High Resolution
오늘 또한 깊이 추정 연구를 가져왔습니다. 하지만.. supervised를 곁들인.. ㅋㅋ 현재 supervised depth estimation은 성능이 거의 Lidar와 유사할 정도로 끌어올려졌는데요. 이제는 얼마나 사물과 배경의 윤곽을…
[ECCV2018] Unified Perceptual Parsing for Scene Understanding
이번에 리뷰할 논문은 다소 옛날? 논문인 2018년도 논문으로 가져와봤습니다. 해당 논문을 알게 된 계기는 Swin-transformer가 segmentation을 평가할 때 사용한 decoder로 해당 논문의 네트워크를 사용했다고 해서…
[CVPR 2017] PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation
Introduction 3D data 의 종류로 위의 3가지가 가장 주로 이용이 된다고 합니다. 각 점들이 그래프 형태로 연결된 Mesh, volume + pixel 이라는 뜻으로 pixel 처럼…
최신 댓글