[AAAI 2023] Frequency Selective Augmentation for Video Representation Learning
Before Review 이번 논문도 Self-Supervised Video Representation Learning 연구로 준비했습니다. LG, NAVER, KAIST가 공동 연구 진행한 논문 입니다. 제목에서 유추할 수 있지만 Video Representation Learning을…
[CVPR 2023] ImageBind: One Embedding Space To Bind Them All
안녕하세요. 백지오입니다. 이번 x-review는 최근 공개된 CVPR 2023 Accepted Paper이자 공개 직후 엄청난 관심(깃허브 스타 5000+)을 받고 있는 ImageBind입니다. 제가 연구해보고 싶었던 분야인 Multimodal Joint Embedding Space 분야를…
[ICLR 2021] Denoising diffusion implicit models. Part 1
이번 리뷰 논문은 저번 리뷰에 이어 diffusion model에 대해 리뷰하고자 합니다. 저번 리뷰에서는 전반적인 흐름을 파악하기 위해 작성했더라면 이번 리뷰에서는 수식도 구체적으로 다뤄볼 예정입니다. 해당…
[CVPR 2019]PVNet: Pixel-Wise Voting Network for 6DoF Pose Estimation
제가 이번에 리뷰할 논문은 6D pose estimation 논문으로 이 분야는 처음 리뷰를 하게 되었습니다. PVNet은 인용수가 현재 728회로, 읽어봐야 할 논문이라 생각하여 리뷰를 하게 되었습니다….
[AAAI 2022] Self-Supervised Spatiotemporal Representation Learning by Exploiting Video Continuity
이번 리뷰에서 다룰 논문의 제목은 <Self-Supervised Spatiotemporal Representation Learning by Exploiting Video Continuity>로, 2022년 AAAI에 게재되었습니다. 원래는 저번 X-Review에서 Part.1까지만 작성되어 있던 논문의 뒷부분을 마무리하려…
[ICML 2017] Deep Bayesian Active Learning with Image Data
오늘은 다소 예에에전 논문을 가져왔습니다. Active learning 의 조상님과 같은 연구인데요. 근본 중의 근본임에도 불구하고 아직 제대로 읽어보지도 리뷰해본 적도 없다는 사실이 제법 놀랐네요. Active…
[ICLR2023] What Do Self-Supervised Vision Transformers Learn?
이번에 소개할 논문은 ICLR2023에 게재된 논문으로, Self-supervised Learning에서 가장 널리 사용되는 두 가지 기법(Contrastive Learning and Mask Image Modeling)들을 Vision Transformer 학습에 사용할 때 각각…
[CVPRw 2022] SCVRL : Shuffled Contrastive Video Representation Learning
Before Review 오늘의 리뷰는 Self-Supervised Video Representation Learning 연구로 준비했습니다. 읽으면서 저랑 조원 연구원이 21~22년도 겨울에 작성했던 TNIP랑 컨셉이 굉장히 비슷하다고 느꼈습니다. 물론 본 논문은…
[ICML 2021] Learning Transferable Visual Models From Natural Language Supervision
<1. Introduction and motivating work> raw text로부터 직접적으로 학습하는 사전학습 방법들은 지난 몇년동안 NLP 분야에서 진화되어왔습니다. standardized input-output inference으로 “text-to-text”가 발전하면서 작업에 구애받지 않는 다운스트림…
[NeurIPS 2022] CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds
본 논문에서는 two-stage의 fully sparse convolutional 3D object detection framework인 CAGroup3D를 제안한다. CAGroup3D에서는 class-aware local group 방식을 통해 object surface voxel에 대해 3d proposals를 생성하고,…
안녕하세요 지연님 좋은 리뷰 감사합니다. SGM 설명해주시는 부분에서 저는 문맥상 SGM이 학습시에만 사용되서 visual feature가 context정보를 학습하도록 돕는다고 이해했는데 "SGM은…