Category: Paper
Paper Review
[AAAI 2024] SPGroup3D: Superpoint Grouping Network for Indoor 3D Object Detection
안녕하세요, 스물 여섯 번째 x-review 입니다. 이번 논문은 2024년도 AAAI에 게재된 SPGroup3D: Superpoint Grouping Network for Indoor 3D Object Detection 입니다. 그럼 바로 리뷰 시작하겠습니다…
[CVPR 2024]SAM-6D: Segment Anything Model Meets Zero-Shot 6D Object Pose Estimation
안녕하세요, 이번에는 이전에 리뷰한 CNOS로부터 확장되어 최종 6D pose까지 추정하는 올해 CVPR accept된 논문입니다. Foundation model 기반으로 하는 이러한 연구 트렌드가 앞으로도 계속해서 이어지는지는 지켜보아야…
[AAAI 2024] Entropic Open-set Active Learning
안녕하세요 정의철 연구원 입니다. 이번에 제가 소개할 논문은 [AAAI 2024] Entropic Open-set Active Learning이란 논문입니다. 지금까지 읽어보았던 Active Learning 논문들은 모두 Closed-set의 상황에서 진행된 연구였는데…
[ICLR 2023] GOOD: Exploring Geometric Cues for Detecting Objects in an Open World
안녕하세요. 해당 논문은 연구실에서 제출 예정인 과제의 1차년도에 사용될 방법으로, 그래서 자세히 읽어본 점도 있지만 RGB 영상에 비해 Depth 영상의 이점, 활용 방안 등을 모색해보고자…
[CVPR 2019] Group-wise Correlation Stereo Network
안녕하세요, 스물여섯 번째 X-Review입니다. 이번 논문은 2019년도 CVPR에게재된 Group-wise Correlation Stereo Network 논문입니다. 그럼 바로 리뷰 시작하겠습니다. ⛹?♀️ 1. Introductio 스테레오 매칭이란 두 이미지 쌍간의…
[ICCV 2023] CNOS: A Strong Baseline for CAD-based Novel Object Segmentation
안녕하세요, 이번 제안서 작업을 위해 unseen object 6D pose estimation을 알아보았는데요. 서베이 중 찾은 논문 중 하나이고 이를 기반으로 계속 연구가 나아가는 것이 보이네요. 이번…
Multi-modal Prompting for Low-Shot Temporal Action Localization
Before Review 오늘은 Temporal Action Localization 논문인데 처음으로 Low/Few Shot 세팅의 논문을 읽어 보게 됐습니다. 해당 논문의 저자가 Temporal Action Localization 관련해서 좋은 연구를 많이…
[CVPR 2022] Weakly Supervised Temporal Sentence Grounding with Gaussian-based Contrastive Proposal Learning
이 논문의 주요 키워드 Weakly Supervised Temporal Sentence Grounding Moment Retrieval 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Temporal Grounding에 대한 이해 (Moment-DETR 리뷰) 안녕하세요….
[CVPR 2023] PointConvFormer: Revenge of the Point-based Convolution
안녕하세요, 스물 다섯 번째 x-review 입니다. 이번 논문은 2023년도 CVPR에 게재된 PointConvFormer: Revenge of the Point-based Convolution으로, 지난 주에 읽은 PointConv의 후속작 입니다. 그럼 바로…
[MDPI Applied Science 2024] VTG-GPT: Tuning-Free Zero-Shot Video Temporal Grounding with GPT
안녕하세요. 오늘의 X-Review에서는 GPT 등의 LLM을 활용해 Temporal Sentence Grounding in Video(TSGV) task를 수행하는 논문을 소개해드리겠습니다. 해당 논문은 중국 대학교에서 연구되었으며 24년도 MDPI Applied Science…
안녕하세요 인택님, 리뷰 잘 읽었습니다. AVQA task에 대해 조금이나마 알아갈 수 있는(?) 시간이었던 것 같습니다. 정말 간단한 질문 두 가지만…