[카테고리:] Paper
Paper Review
[ICRA 2020] YCB-M: A Multi-Camera RGB-D Dataset for Object Recognition and 6DoF Pose Estimation
안녕하세요, 이번에도 데이터셋 논문입니다. 기존 6D pose estimation 테스크에서 사용되었던 YCB-V라는 데이터셋의 단일 센서가 아닌 여러 센서를 통해 취득한 데이터셋입니다. YCB는 Yale-CMU-Berkeley의 약어로 3개의 대학에서…
[AAAI 2023] Phrase-level Relationship Mining for Temporal Sentence Localization
오늘의 X-Review 또한 Temporal Sentence Grounding in Videos(TSGV) task 방법론으로 가져왔습니다. 23년도 AAAI에 게재되었으며 중국 북경대의 연구 결과입니다. 최근 연구실 전체적으로 제안서 작업이 한창인데요, 저희…
[CVPR 2022] Bridged Transformer for Vision and Point Cloud 3D Object Detection
안녕하세요, 스물 두 번째 x-review 입니다. 이번 논문은 2022년도 CVPR에 게재된 포인트 클라우드와 이미지 정보를 융합하여 3D Object Detection을 수행하는 논문 입니다. 그럼 바로 리뷰 시작하겠습니다…
[CVPR 2023] You Can Ground Earlier than See: An Effective and Efficient Pipeline for Temporal Sentence Grounding in Compressed Videos
안녕하세요. 이번 주 X-Review는 23년도 CVPR에 게재된 <You Can Ground Earlier than See: An Effective and Efficient Pipeline for Temporal Sentence Grounding in Compressed Videos>입니다….
[ACM Computing Surveys 2021] A Survey of Deep Active Learning
안녕하세요 정의철 연구원입니다. 제가 이번에 리뷰할 논문은 ‘A Survey of Deep Active Learning’입니다. 먼저 Active Learning관련 논문을 리뷰하기 전에 지금까지 Active Learning의 큰 흐름을 잡고난…
[NIPS 2021] QVHIGHLIGHTS: Detecting Moments and Highlights in Videos via Natural Language Queries (Moment-DETR)
이 논문의 주요 키워드 Temporal Grounding Moment Retrieval Highlight Detection DETR 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive learning에 대한 이해 (CLIP 리뷰…
[MM 2022] Counterfactual Reasoning for Out-of-distribution Multimodal Sentiment Analysis
Introduction Sentimental analysis란 텍스트의 어조가 긍정적인지, 부정적인지 혹은 중립적인지를 분석하는 task입니다. 최근에는 sns등에 image, audio, video 등 여러 모달리티를 통한 expression이 증가하였고, 이에 따라 Multimodal…
[CVPR 2020] AANet: Adaptive Aggregation Network for Efficient Stereo Matching
안녕하세요, 스물두 번째 X-Review입니다. 이번 논문은 2020년도 CVPR에게재된 AANet: Adaptive Aggregation Network for Efficient Stereo Matching 논문입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction 전통적인…
[ACM MM 2023] Open-Vocabulary Object Detection via Scene Graph Discovery
Before Review OTT 과제 제안서 작업 과정에서 Open-Vocabulary Object Detection에 대해서 서베이를 하고 있습니다. 마침 Open-Vocabulary Object Detection 문제를 Scene Graph와 접목 시켜서 푸는 연구가…
[ICCV 2023] ImGeoNet: Image-induced Geometry-aware Voxel Representation for Multi-view 3D Object Detection
안녕하세요, 스물 한 번째 x-review 입니다. 이번 논문은 2023년도 ICCV에 게재된 이미지 3D Object Detection 논문 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction indoor 기반…
최신 댓글