Category: X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[RA-L 2023]i2c-net: Using Instance-Level Neural Networks for Monocular Category-Level 6D Pose Estimation
안녕하세요. 제가 이번에 리뷰할 논문도 6D Pose Estimation 논문으로, instance-level의 6D를 category-Level로 확장하는 방법론입니다. 제가 주로 리뷰하고 실험하고 있는 방법론들은 주로 instance-level의 방식으로 정확도 측면에…
[ICCV 2023 oral] Scalable Diffusion Models with Transformers
[ Projet, Paper, Code ] 이번 논문 리뷰로 오랜만에 diffusion model을 들고 왔습니다. 기존 diffusion model들이 관행처럼 사용해오던 U-Net 구조의 backbone을 transformer로 나이브하게 변경한 논문입니다….
[NIPS 2023] Efficient Coding of Natural Images using Maximum Manifold Capacity Representations
이 논문의 주요 키워드 Representation Learning Self-supervised Learning 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Self-supervised representation learning에 대한 이해 SimCLR (주영님 리뷰) Barlow Twins…
[TPAMI 2023] General Greedy De-Bias Learning
안녕하세요! 이번에는 저번에 리뷰했던 GGE의 후속 논문인 GGD를 가져와봤습니다! 지난번과 마찬가지로 de-bias에 초점을 맞춘 논문이고요. 차이점이 있다면 GGE의 경우 VQA task에서의 de-bias를 초점을 맞췄다면 이번…
[3DV 2022]SC6D: Symmetry-agnostic and Correspondence-free 6D Object Pose Estimation
Abstract 해당 논문은 단일 RGB로부터 symmetry-agnostic(객체의 대칭 여부에 관한 정보를 주지 않아도 된다는 의미) 하고 correspoondence-free(3D model을 쓰지 않는 방식이라 이렇게 표현한 것으로 보입니다)의 객체의…
[NeurIPS 2022] Active Learning Helps Pretrained Models Learn the Intended Task
안녕하세요. 허재연입니다. 평소처럼 Active Learning 논문을 가지고 왔습니다. 평소에 Active Learning과 Self-supervised learning을 결합시킨 방법론은 없을까 막연하게 궁금했었는데 관련 논문이 있어 읽어보게 되었습니다. Active Learning의…
[CVPR 2022](Oral) Practical Stereo Matching via Cascaded Recurrent Network with Adaptive Correlation
안녕하세요, 스물세 번째 X-Review입니다. 이번 논문은 2022년도 CVPR에게재된 Practical Stereo Matching via Cascaded Recurrent Network with Adaptive Correlation 논문입니다. 그럼 바로 리뷰 시작하겠습니다. ? 1….
[ICLR 2021 Spotlight] Tent- Fully Test time Adaptation by Entropy Minimization
안녕하세요.오늘 작성할 리뷰는 Test-Time Adaptation, 줄여서 TTA 분야의 논문입니다. 본 논문은 TTA 분야에서 baseline 격이라고도 불리는 논문입니다.그럼 리뷰 시작하도록 하겠습니다. 1. Introduction 저희가 이때까지 다뤄왔던…
[AAAI2019]Multilevel Language and Vision Integration for Text-to-Clip Retrieval
안녕하세요. 오늘은 moment retrieval (video temporal grounding) task를 다룬 논문입니다. 바로 리뷰 시작하겠습니다. 이 논문은 untrimmed video(편집되지 않은 영상)에서 자연어 쿼리를 통해 temporal segments를 retrieving하는…
[CVPR 2023] PiMAE: Point Cloud and Image Interactive Masked Autoencoders for 3D Object Detection
안녕하세요, 스물 세 번째 x-review 입니다. 이번 논문은 2023년도 CVPR에 게재된 PiMAE: Point Cloud and Image Interactive Masked Autoencoders for 3D Object Detection 입니다. 그럼 바로…
안녕하세요, 예은님 좋은 댓글 감사합니다. LVU task 중에서도 DB를 생성하고 평가하는 RAG방식의 방법론은 일반적으로 오프라인으로 DB를 생성하는 과정이 오래걸리는 것을…