[카테고리:] Paper
Paper Review
[CVPR 2019] Normalized Object Coordinate Space for Category-Level 6D Object Pose and Size Estimation
안녕하세요. 이번에도 6D pose estimation 관련 논문 리뷰를 진행합니다. 좋은 기업들과 학교에서 참여한 논문이라 매우 신뢰도가 올라가는 것 같습니다. 이번 논문은 unseen object에 대한 pose…
[CVPR 2022] Everything at Once – Multi-modal Fusion Transformer for Video Retrieval
이런 분들께 이 논문을 추천드립니다. 멀티 모달, 특히 비디오를 멀티 모달(영상 + 오디오 + 텍스트)로 이해하는 것에 흥미가 있으신 분 뭔가 새로운 걸 보고 싶으신…
[ICCV 2019] Clustered Object Detection in Aerial Images
안녕하세요. 열 일곱번째입니다. 이번에 리뷰할 논문은 이전의 Aerial Images 관련 object detection을 리뷰와 세미나를 통해 소개하였으며 해당 아이디어를 Pedestrian detection에 적용하고자 실험을 진행했으나 풀고자 하는…
[ICCV 2021] An End-to-End Transformer Model for 3D Object Detection
안녕하세요, 여덟번째 x-review 입니다. 이번 논문은 transformer를 기반으로 한 3D Object Detection 방법론인 3DETR 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction irregular하고 sparse한 포인트…
[ECCV-2018] Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary
안녕하세요 여덟 번째 X-Review입니다. 금주 리뷰할 논문은 ECCV 2018에 게재된 <Mask TexSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes>입니다. 바로 리뷰…
[ICLR 2020] A Simple Framework for Contrastive Learning of Visual Representations
안녕하세요, 허재연입니다. 이번에 리뷰할 논문은 Google research team에서 2020년에 발표한 SimCLR이라는 self-supervised learning 방법론입니다. 인공지능의 대부 제프리 힌튼이 공저자인게 눈에 띕니다. 이 방법론은 MoCo, BYOL,…
[CVPR 2020]Single-Stage 6D Object Pose Estimation
안녕하세요, 양희진입니다. 이번에도 6D pose estimation 논문을 가져왔습니다. single-stage로 pose를 추정한다고 해서 해당 논문을 구현한 코드를 보니correspondence-extraction 모델에 따라 loss를 보면 어떤 correspondence-extraction 모델을 쓸지에…
[IJCV 2022] DnS: Distill-and-Select for Efficient and Accurate Video Indexing and Retrieval
안녕하세요. 백지오입니다. 열 번째 X-REVIEW는 Knowledge Distillation 기반의 Video Retrieval 방법인 DnS입니다. 저널 논문은 이번에 처음 읽어보았는데, 투 컬럼 22 페이지의 압도적인 분량에 그만 정신이…
[AAAI 2023] Video event extraction via tracking visual states of arguments
Before Review 새로운 분야에 대해서 리뷰를 하게 되었습니다. Video Event Extraction 이라는 방법입니다. 우선 저는 Video Scene Segmentation 이라는 분야에 대해서 본격적으로 연구를 하려고 합니다….
[CVPR 2023] Distilling Vision-Language Pre-training to Collaborate with Weakly-Supervised Temporal Action Localization
이번 X-Review 또한 올해 CVPR에 게재된 Weakly-Supervised Temporal Action Localization (WTAL) 논문 중 하나로, 제목은 <Distilling Vision-Language Pre-training to Collaborate with Weakly-Supervised Temporal Action Localization>입니다….
최신 댓글