Author: rcvlab

RCV연구실 홈페이지 관리자 입니다.
Posted in Paper X-Review

[CVPR 2022] Everything at Once – Multi-modal Fusion Transformer for Video Retrieval

이런 분들께 이 논문을 추천드립니다. 멀티 모달, 특히 비디오를 멀티 모달(영상 + 오디오 + 텍스트)로 이해하는 것에 흥미가 있으신 분 뭔가 새로운 걸 보고 싶으신…

Continue Reading
Posted in Paper X-Review

[CVPR 2020]Single-Stage 6D Object Pose Estimation

안녕하세요, 양희진입니다. 이번에도 6D pose estimation 논문을 가져왔습니다. single-stage로 pose를 추정한다고 해서 해당 논문을 구현한 코드를 보니correspondence-extraction 모델에 따라 loss를 보면 어떤 correspondence-extraction 모델을 쓸지에…

Continue Reading
Posted in Paper X-Review

[IJCV 2022] DnS: Distill-and-Select for Efficient and Accurate Video Indexing and Retrieval

안녕하세요. 백지오입니다. 열 번째 X-REVIEW는 Knowledge Distillation 기반의 Video Retrieval 방법인 DnS입니다. 저널 논문은 이번에 처음 읽어보았는데, 투 컬럼 22 페이지의 압도적인 분량에 그만 정신이…

Continue Reading
Posted in X-Review

[ECCV 2022] Masked Autoencoders for Point Cloud Self-supervised Learning

본 논문에서는 위치 정보 유출, 불균일한 information density를 포함하는 point cloud의 특성이 제기하는 문제를 해결하기 위해 point cloud self-supervised learning을 위한 masked autoencoder구조의 방식을 제안한다….

Continue Reading
Posted in Paper X-Review

[CVPR 2020]HybridPose: 6D Object Pose Estimation under Hybrid Representations

안녕하세요, 양희진입니다. 오늘은 6D pose estimation 문제를 풀기 위해 refinement를 어떻게 할지를 다루는 논문입니다. 수식적인 부분이 이번에도 확실히 어렵긴 한 것 같습니다. 글의 중간 중간에…

Continue Reading
Posted in Paper X-Review

[WACV 2021] TCA: Temporal Context Aggregation for Video Retrieval with Contrastive Learning

안녕하세요. 백지오입니다. 아홉 번째 X-REVIEW는 Video Retrieval 분야에서 2021년 제안된 논문인 TCA입니다. 아시다시피 영상은 수많은 프레임(이미지)들로 구성되며, 이러한 프레임들에 포함된 시각적 정보들이 시간이 흐름에 따라…

Continue Reading
Posted in Paper X-Review

[AAAI 2020] Background Suppression Network for Weakly-Supervised Temporal Action Localization

안녕하세요. 백지오입니다. 여덟 번째 X-REVIEW는 Temporal Action Localization (TAL) task에 약지도학습을 적용한 방법인 Background Suppression Network, BaS-NET 리뷰입니다. 본격적인 리뷰에 앞서, Temporal Action Localization task에…

Continue Reading
Posted in X-Review

[ECCV 2022] Masked Discrimination for Self-Supervised Learning on Point Clouds

masked autoencoding은 language와 image domain에서 self-supervised learning에 큰 성공을 거두었다. 하지만 masking방식 기반의 pretraining은 3d point cloud를 이해하는데 있어서 이점을 아직 보여주지 못했다. 이에 대해…

Continue Reading
Posted in Paper X-Review

[ICCV 2021]SO-Pose: Exploiting Self-Occlusion for Direct 6D Pose Estimation

안녕하세요, 양희진입니다. 이번에도 6D Pose estimation 관련 논문입니다. 예전에 꽤 최근에 이 논문을 찾게 되었고, 수식적인 부분은 꽤 어려웠으나 괜찮은 접근법인 것 같아 한 번…

Continue Reading
Posted in X-Review

[CVPR 2020] Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection

object detection은 대부분 anchor-based detector가 주를 이뤄왔고 anchor-free방식이 점차 등장하기 시작했다. 결론적으로 말하자면 본 논문에서는 먼저 anchor-based와 anchor-free 방식 사이의 주요한 차이는 사실 positive sample과…

Continue Reading