Category: X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[ICRA 2020] YCB-M: A Multi-Camera RGB-D Dataset for Object Recognition and 6DoF Pose Estimation
안녕하세요, 이번에도 데이터셋 논문입니다. 기존 6D pose estimation 테스크에서 사용되었던 YCB-V라는 데이터셋의 단일 센서가 아닌 여러 센서를 통해 취득한 데이터셋입니다. YCB는 Yale-CMU-Berkeley의 약어로 3개의 대학에서…
[ICLR 2017] Pruning Filters for Efficient ConvNets
이번주는 model compression 중 pruning 논문에 대해 다룬 “Pruning Filters for Efficient ConvNets”논문을 읽어보았습니다. 이 논문이 conv에 pruning을 적용한 근본 논문으로 볼 수 있는데요, 당분간…
[AAAI 2023] Phrase-level Relationship Mining for Temporal Sentence Localization
오늘의 X-Review 또한 Temporal Sentence Grounding in Videos(TSGV) task 방법론으로 가져왔습니다. 23년도 AAAI에 게재되었으며 중국 북경대의 연구 결과입니다. 최근 연구실 전체적으로 제안서 작업이 한창인데요, 저희…
[CVPR 2022] Bridged Transformer for Vision and Point Cloud 3D Object Detection
안녕하세요, 스물 두 번째 x-review 입니다. 이번 논문은 2022년도 CVPR에 게재된 포인트 클라우드와 이미지 정보를 융합하여 3D Object Detection을 수행하는 논문 입니다. 그럼 바로 리뷰 시작하겠습니다…
[CVPR 2023] You Can Ground Earlier than See: An Effective and Efficient Pipeline for Temporal Sentence Grounding in Compressed Videos
안녕하세요. 이번 주 X-Review는 23년도 CVPR에 게재된 <You Can Ground Earlier than See: An Effective and Efficient Pipeline for Temporal Sentence Grounding in Compressed Videos>입니다….
[ACM Computing Surveys 2021] A Survey of Deep Active Learning
안녕하세요 정의철 연구원입니다. 제가 이번에 리뷰할 논문은 ‘A Survey of Deep Active Learning’입니다. 먼저 Active Learning관련 논문을 리뷰하기 전에 지금까지 Active Learning의 큰 흐름을 잡고난…
[NIPS 2021] QVHIGHLIGHTS: Detecting Moments and Highlights in Videos via Natural Language Queries (Moment-DETR)
이 논문의 주요 키워드 Temporal Grounding Moment Retrieval Highlight Detection DETR 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive learning에 대한 이해 (CLIP 리뷰…
[ICCV2023]Deep Fusion Transformer Network with Weighted Vector-Wise Keypoints Voting for Robust 6D Object Pose Estimation
제가 이번에 리뷰할 논문도 6D pose Estimation 연구입니다. Abstract 해당 논문은 RGBD 기반의 6D Pose Estimation 논문으로, 색상 정보와 깊이 정보를 효과적으로 융합하여 자세 추정을…
[MM 2022] Counterfactual Reasoning for Out-of-distribution Multimodal Sentiment Analysis
Introduction Sentimental analysis란 텍스트의 어조가 긍정적인지, 부정적인지 혹은 중립적인지를 분석하는 task입니다. 최근에는 sns등에 image, audio, video 등 여러 모달리티를 통한 expression이 증가하였고, 이에 따라 Multimodal…
[CVPR 2020] AANet: Adaptive Aggregation Network for Efficient Stereo Matching
안녕하세요, 스물두 번째 X-Review입니다. 이번 논문은 2020년도 CVPR에게재된 AANet: Adaptive Aggregation Network for Efficient Stereo Matching 논문입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction 전통적인…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…