[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[ICCV 2021] An End-to-End Transformer Model for 3D Object Detection
안녕하세요, 여덟번째 x-review 입니다. 이번 논문은 transformer를 기반으로 한 3D Object Detection 방법론인 3DETR 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction irregular하고 sparse한 포인트…
[ECCV-2018] Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary
안녕하세요 여덟 번째 X-Review입니다. 금주 리뷰할 논문은 ECCV 2018에 게재된 <Mask TexSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes>입니다. 바로 리뷰…
[ICLR 2020] A Simple Framework for Contrastive Learning of Visual Representations
안녕하세요, 이번에 리뷰할 논문은 Google research team에서 2020년에 발표한 SimCLR이라는 self-supervised learning 방법론입니다. 인공지능의 대부 제프리 힌튼이 공저자인게 눈에 띕니다. 이 방법론은 MoCo, BYOL, Barlow…
[CVPR 2020]Single-Stage 6D Object Pose Estimation
안녕하세요, 양희진입니다. 이번에도 6D pose estimation 논문을 가져왔습니다. single-stage로 pose를 추정한다고 해서 해당 논문을 구현한 코드를 보니correspondence-extraction 모델에 따라 loss를 보면 어떤 correspondence-extraction 모델을 쓸지에…
[ICCV2021](Oral) Motion Basis Learning for Unsupervised Homography Estimation with Subspace Projection
이번에 소개할 논문은 21년도 ICCV oral paper로 게재된 논문으로, 비지도학습 방식의 호모그래피 추정 방법론을 새롭게 제안합니다. Preliminary 호모그래피는 다들 아시다시피 2D plane과 2D plane 사이에…
[CVPR 2023] Soft-Landing Strategy for Alleviating the Task Discrepancy Problem in Temporal Action Localization Tasks
임근택 연구원님이 최근에 리뷰하긴 했는데, 저도 비슷한 논리로 실험을 수행중인 부분이 있어 참고차 읽어봤습니다. 제가 재밌게 읽었던 UBoCo 저자분 논문이더라고요. Introduction 이 논문에서 다루는 분야는…
[IJCV 2022] DnS: Distill-and-Select for Efficient and Accurate Video Indexing and Retrieval
안녕하세요. 백지오입니다. 열 번째 X-REVIEW는 Knowledge Distillation 기반의 Video Retrieval 방법인 DnS입니다. 저널 논문은 이번에 처음 읽어보았는데, 투 컬럼 22 페이지의 압도적인 분량에 그만 정신이…
[AAAI 2023] Video event extraction via tracking visual states of arguments
Before Review 새로운 분야에 대해서 리뷰를 하게 되었습니다. Video Event Extraction 이라는 방법입니다. 우선 저는 Video Scene Segmentation 이라는 분야에 대해서 본격적으로 연구를 하려고 합니다….
[CVPR 2023] Distilling Vision-Language Pre-training to Collaborate with Weakly-Supervised Temporal Action Localization
이번 X-Review 또한 올해 CVPR에 게재된 Weakly-Supervised Temporal Action Localization (WTAL) 논문 중 하나로, 제목은 <Distilling Vision-Language Pre-training to Collaborate with Weakly-Supervised Temporal Action Localization>입니다….
[ECCV 2022] Masked Autoencoders for Point Cloud Self-supervised Learning
본 논문에서는 위치 정보 유출, 불균일한 information density를 포함하는 point cloud의 특성이 제기하는 문제를 해결하기 위해 point cloud self-supervised learning을 위한 masked autoencoder구조의 방식을 제안한다….
최신 댓글