Category: X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in Paper X-Review

[AAAI 2023] Frequency Selective Augmentation for Video Representation Learning

Before Review 이번 논문도 Self-Supervised Video Representation Learning 연구로 준비했습니다. LG, NAVER, KAIST가 공동 연구 진행한 논문 입니다. 제목에서 유추할 수 있지만 Video Representation Learning을…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] ImageBind: One Embedding Space To Bind Them All

안녕하세요. 백지오입니다. 이번 x-review는 최근 공개된 CVPR 2023 Accepted Paper이자 공개 직후 엄청난 관심(깃허브 스타 5000+)을 받고 있는 ImageBind입니다. 제가 연구해보고 싶었던 분야인 Multimodal Joint Embedding Space 분야를…

Continue Reading
Posted in Conference News Paper X-Review

[ICLR 2021] Denoising diffusion implicit models. Part 1

이번 리뷰 논문은 저번 리뷰에 이어 diffusion model에 대해 리뷰하고자 합니다. 저번 리뷰에서는 전반적인 흐름을 파악하기 위해 작성했더라면 이번 리뷰에서는 수식도 구체적으로 다뤄볼 예정입니다. 해당…

Continue Reading
Posted in News X-Review

[CVPR 2019]PVNet: Pixel-Wise Voting Network for 6DoF Pose Estimation

제가 이번에 리뷰할 논문은 6D pose estimation 논문으로 이 분야는 처음 리뷰를 하게 되었습니다. PVNet은 인용수가 현재 728회로, 읽어봐야 할 논문이라 생각하여 리뷰를 하게 되었습니다….

Continue Reading
Posted in Paper X-Review

[AAAI 2022] Self-Supervised Spatiotemporal Representation Learning by Exploiting Video Continuity

이번 리뷰에서 다룰 논문의 제목은 <Self-Supervised Spatiotemporal Representation Learning by Exploiting Video Continuity>로, 2022년 AAAI에 게재되었습니다. 원래는 저번 X-Review에서 Part.1까지만 작성되어 있던 논문의 뒷부분을 마무리하려…

Continue Reading
Posted in X-Review

[ICML 2017] Deep Bayesian Active Learning with Image Data

오늘은 다소 예에에전 논문을 가져왔습니다. Active learning 의 조상님과 같은 연구인데요. 근본 중의 근본임에도 불구하고 아직 제대로 읽어보지도 리뷰해본 적도 없다는 사실이 제법 놀랐네요. Active…

Continue Reading
Posted in Conference X-Review

[ICLR2023] What Do Self-Supervised Vision Transformers Learn?

이번에 소개할 논문은 ICLR2023에 게재된 논문으로, Self-supervised Learning에서 가장 널리 사용되는 두 가지 기법(Contrastive Learning and Mask Image Modeling)들을 Vision Transformer 학습에 사용할 때 각각…

Continue Reading
Posted in Paper X-Review

[CVPRw 2022] SCVRL : Shuffled Contrastive Video Representation Learning

Before Review 오늘의 리뷰는 Self-Supervised Video Representation Learning 연구로 준비했습니다. 읽으면서 저랑 조원 연구원이 21~22년도 겨울에 작성했던 TNIP랑 컨셉이 굉장히 비슷하다고 느꼈습니다. 물론 본 논문은…

Continue Reading
Posted in X-Review

[ICML 2021] Learning Transferable Visual Models From Natural Language Supervision

<1. Introduction and motivating work> raw text로부터 직접적으로 학습하는 사전학습 방법들은 지난 몇년동안 NLP 분야에서 진화되어왔습니다. standardized input-output inference으로 “text-to-text”가 발전하면서 작업에 구애받지 않는 다운스트림…

Continue Reading
Posted in X-Review

[NeurIPS 2022] CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds

본 논문에서는 two-stage의 fully sparse convolutional 3D object detection framework인 CAGroup3D를 제안한다. CAGroup3D에서는 class-aware local group 방식을 통해 object surface voxel에 대해 3d proposals를 생성하고,…

Continue Reading