Category: X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[ICLR 2021] Denoising diffusion implicit models. Part 1
이번 리뷰 논문은 저번 리뷰에 이어 diffusion model에 대해 리뷰하고자 합니다. 저번 리뷰에서는 전반적인 흐름을 파악하기 위해 작성했더라면 이번 리뷰에서는 수식도 구체적으로 다뤄볼 예정입니다. 해당…
[CVPR 2019]PVNet: Pixel-Wise Voting Network for 6DoF Pose Estimation
제가 이번에 리뷰할 논문은 6D pose estimation 논문으로 이 분야는 처음 리뷰를 하게 되었습니다. PVNet은 인용수가 현재 728회로, 읽어봐야 할 논문이라 생각하여 리뷰를 하게 되었습니다….
[AAAI 2022] Self-Supervised Spatiotemporal Representation Learning by Exploiting Video Continuity
이번 리뷰에서 다룰 논문의 제목은 <Self-Supervised Spatiotemporal Representation Learning by Exploiting Video Continuity>로, 2022년 AAAI에 게재되었습니다. 원래는 저번 X-Review에서 Part.1까지만 작성되어 있던 논문의 뒷부분을 마무리하려…
[ICML 2017] Deep Bayesian Active Learning with Image Data
오늘은 다소 예에에전 논문을 가져왔습니다. Active learning 의 조상님과 같은 연구인데요. 근본 중의 근본임에도 불구하고 아직 제대로 읽어보지도 리뷰해본 적도 없다는 사실이 제법 놀랐네요. Active…
[ICLR2023] What Do Self-Supervised Vision Transformers Learn?
이번에 소개할 논문은 ICLR2023에 게재된 논문으로, Self-supervised Learning에서 가장 널리 사용되는 두 가지 기법(Contrastive Learning and Mask Image Modeling)들을 Vision Transformer 학습에 사용할 때 각각…
[CVPRw 2022] SCVRL : Shuffled Contrastive Video Representation Learning
Before Review 오늘의 리뷰는 Self-Supervised Video Representation Learning 연구로 준비했습니다. 읽으면서 저랑 조원 연구원이 21~22년도 겨울에 작성했던 TNIP랑 컨셉이 굉장히 비슷하다고 느꼈습니다. 물론 본 논문은…
[ICML 2021] Learning Transferable Visual Models From Natural Language Supervision
<1. Introduction and motivating work> raw text로부터 직접적으로 학습하는 사전학습 방법들은 지난 몇년동안 NLP 분야에서 진화되어왔습니다. standardized input-output inference으로 “text-to-text”가 발전하면서 작업에 구애받지 않는 다운스트림…
[NeurIPS 2022] CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds
본 논문에서는 two-stage의 fully sparse convolutional 3D object detection framework인 CAGroup3D를 제안한다. CAGroup3D에서는 class-aware local group 방식을 통해 object surface voxel에 대해 3d proposals를 생성하고,…
[arXiv 2017] PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes
안녕하세요, 로보틱스 팀 양희진이라고 합니다. 이번에는 6D pose estimation에 대한 논문인 PoseCNN을 리뷰 해보았습니다. 일단 PoseCNN 을 읽은 이유는 6D pose estimation에서 인용수가 꽤 많은…
[arXiv 2023] VVS: Video-to-Video Retrieval with Irrelevant Frame Suppression
안녕하세요. 백지오입니다. 두 번째 x-review는 지난주에 이어 video retrieval 분야의 논문이자, 우리 연구실에서 작성된 논문인 VVS를 들고 왔습니다. 본격적으로 비디오팀에서 기초 교육을 받기 시작한 3월부터…
안녕하세요 정민님 깔끔한 리뷰 감사합니다. 말씀하신 것처럼 약간 지도학습기반으로 다시 회귀하는 점이 장점이자 단점이라고 생각할 수 있을 것 같습니다. 제가…