[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[arXiv 2023] Point-GCC: Universal Self-supervised 3D Scene Pre-training via Geometry-Color Contrast
안녕하세요, 서른 한번째 x-review 입니다. 이번 논문은 2023년도 arXiv에 올라온 Point-GCC: Universal Self-supervised 3D Scene Pre-training via Geometry-Color Contrast입니다. 일년 동안 SUN RGB-D 데이터셋에서 SOTA를…
[CVPR 2023] Query-Dependent Video Representation for Moment Retrieval and Highlight Detection
안녕하세요. 이번 주 X-Review에서는 23년도 CVPR에 게재된 <Query-Dependent Video Representation for Moment Retrieval and Highlight Detection>이라는 논문을 소개해드리겠습다. 성균관대 허재필 교수님 연구실에서 나온 논문이며, 해당…
[INTERSPEECH 2021] Rethinking Evaluation in ASR: Are Our Models Robust Enough?
이번이 읽은 논문은 Interspeech 2021에서 발표된 “Rethinking Evaluation in ASR: Are Our Models Robust Enough?”논문으로, 음성인식 task에 관한 논문입니다. 음성 모델의 일반화 성능을 올리기 위해…
[CVPR 2023] Pooling Revisited: Your Receptive Field is Suboptimal
안녕하세요, 서른세 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 올라온 Pooling Revisited: Your Receptive Filed is Suboptimal입니다. 바로 시작하도록 하겠습니다. 🐒 1. Introduction Computer vision을 포함한…
[NeurIPS 2020] Bootstrap Your Own Latent A New Approach to Self-Supervised Learning
안녕하세요 정의철 연구원입니다. 제가 이번에 소개할 논문은 ‘Bootstrap Your Own Latent A New Approach to Self-Supervised Learning’이고 흔히 BYOL이라고 불리는 논문입니다. 저는 최근 Self-supervised learning…
[3DV 2022(Oral)]PIZZA: A Powerful Image-only Zero-Shot Zero-CAD Approach to 6 DoF Tracking
제가 이번에 리뷰할 논문도 Object Pose Estimation에 관한 논문입니다. 해당 논문의 저자도 제가 이전에 리뷰했던 논문의 저자로, 지난주에 리뷰한 NOPE에서 베이스라인으로 삼았던 논문입니다. Abstract 로보틱스와…
[NAACL 2024] Emotion-Anchored Contrastive Learning Framework for Emotion Recognition in Conversation
안녕하세요! 이번에도 ERC 논문입니다. 그런데 멀티모달 논문이 아닌 NLP 논문인데요. 감정 인식 논문을 읽다보면 항상 나오는 ‘유사한 감정은 어떻게 구별할까’에 대한 문제를 주제 있게 다룬…
[arXiv 2024] GenFlow: Generalizable Recurrent Flow for 6D Pose Refinement of Novel Objects
안녕하세요, 이번에는 무려 네이버 랩스에서 제안한 unseen object pose estimation의 과정 중 refiner를 다룬 논문을 읽어보았습니다. 생소한 내용도 많아서 읽는 데 상당히 오래 걸렸네요.. BOP…
[CVPR 2023] Learning to Generate Language-supervised and Open-vocabulary Scene Graph using Pre-trained Visual-Semantic Space
Before Review 안녕하세요 이번 리뷰도 Scene Graph Generation과 관련된 리뷰를 작성하였습니다. 이번 논문 같은 경우는 Weakly Supervised Learning + Open Vocabulary Learning 상황에서 Scene Graph…
[ICCV2023] Vision Transformer Adapters for Generalizable Multitask Learning
이번에 소개드릴 논문은 ICCV2023에 게재된 논문으로 Adapter를 활용하여 Multitask learning을 수행하는 논문입니다. 본 논문이 요즘 핫한 키워드인 adapter부터해서 zero-shot task transfer, domain generalization 등등 온갖…
최신 댓글