[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[ICCV2017]Localizing Moments in Video with Natural Language
안녕하세요. 오늘 제가 소개할 논문은 ICCV 2017에 개재된 Localizing Moments in Video with Natural Language입니다. 비디오 태스크 중 하나인 Moment Retrieval을 최초로 다룬 논문입니다. Moment…
[NIPS 2019] BatchBALD: Efficient and Diverse Batch Acquisition for Deep Bayesian Active Learning
안녕하세요 정의철 연구원입니다. 제가 이번에 리뷰할 논문은 BatchBALD(Batch Acquisition for Deep Bayesian Active Learning)입니다. 이는 기존 BALD에서 딥러닝 학습에 적용시키기 위해 batch의 개념을 적용시켜 새롭게…
[CVPR 2020] KeyPose: Multi-View 3D Labeling and Keypoint Estimation for Transparent Objects
안녕하세요, 이번에도 6D pose estimation의 데이터셋 논문입니다. KeyPose라는 모델을 사용하여 저자가 제안한 데이터셋에 적용한 것 까지가 해당 논문의 전체적인 흐름인데요. 특별한 점은 투명한 물체를 사용한 것…
[ICCV 2023] Localizing Moments in Long Video Via Multimodal Guidance
이 논문의 주요 키워드 Temporal Grounding Moment Retrieval Long-form video 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Temporal Grounding에 대한 이해 (Moment-DETR 리뷰) 안녕하세요. 백지오입니다….
[ICCV 2021] Greedy Gradient Ensemble for Robust Visual Question Answering
안녕하세요. 이번에도 VQA 논문을 가져오게 되었습니다. 요즘 VQA 방법론에 대해서 흥미로운 부분이 많다고 느꼈는데, 이번에 초청 세미나 때 조재원 교수님께서 추천한 논문이 있는데 그 논문의…
[ECCV 2016] Unsupervised Learning of Visual Representations by Solving Jigsaw Puzzles
오랜만에 Representation Learning 논문을 들고 왔습니다. Representation Learning은 data 부족 및 학습 비용 절감을 해결하고자 하는 방법 중 하나로, self-supervised learning, unsupervised learning의 하위 분야로…
[ICRA 2020] YCB-M: A Multi-Camera RGB-D Dataset for Object Recognition and 6DoF Pose Estimation
안녕하세요, 이번에도 데이터셋 논문입니다. 기존 6D pose estimation 테스크에서 사용되었던 YCB-V라는 데이터셋의 단일 센서가 아닌 여러 센서를 통해 취득한 데이터셋입니다. YCB는 Yale-CMU-Berkeley의 약어로 3개의 대학에서…
[ICLR 2017] Pruning Filters for Efficient ConvNets
이번주는 model compression 중 pruning 논문에 대해 다룬 “Pruning Filters for Efficient ConvNets”논문을 읽어보았습니다. 이 논문이 conv에 pruning을 적용한 근본 논문으로 볼 수 있는데요, 당분간…
[AAAI 2023] Phrase-level Relationship Mining for Temporal Sentence Localization
오늘의 X-Review 또한 Temporal Sentence Grounding in Videos(TSGV) task 방법론으로 가져왔습니다. 23년도 AAAI에 게재되었으며 중국 북경대의 연구 결과입니다. 최근 연구실 전체적으로 제안서 작업이 한창인데요, 저희…
[CVPR 2022] Bridged Transformer for Vision and Point Cloud 3D Object Detection
안녕하세요, 스물 두 번째 x-review 입니다. 이번 논문은 2022년도 CVPR에 게재된 포인트 클라우드와 이미지 정보를 융합하여 3D Object Detection을 수행하는 논문 입니다. 그럼 바로 리뷰 시작하겠습니다…
최신 댓글