[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[CVPR 2015] Show and Tell: A Neural Image Caption Generator
안녕하세요. 이번에는 2015년에 Google에서 발표한 논문을 가져와 봤습니다. 이번 학기에 수강하고 있는 수업에서 이미지 캡셔닝이 언급되어서 궁금하여 읽어보게 되었습니다. 이미지 캡셔닝 분야에서는 Show and Tell…
[AAAI 2023] TransVCL: Attention-enhanced Video Copy Localization Network with Flexible Supervision
안녕하세요 오늘은 video copy localization인데, copy detection 논문을 들고왔습니다. 들어가기 전에 컨셉 중에서 일부가 저희 CVPR 논문과 유사해보이는 부분이 있어서 딱 눈에 보여서 읽게되었네요. 참고로…
[arXiv 2022] DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection
이번에 리뷰할 논문은 물체 검출 방법론 입니다. 트랜스포머 기반의 물체검출 중 DETR 계열의 방법론 중 처음으로 COCO 리더보드의 SOTA를 달성한 논문입니다. 현 시점에서는 해당 논문에서…
[PMLR 2020]Coresets for Data-efficient Training of Machine Learning Models
Open Question:How to select a training data subset that can theoretically and practically performs on par with the full dataset.어떻게 일부 데이터셋으로 전체데이터셋을 학습한것과 같은…
[IROS 2021]Super odometry: IMU-centric LiDAR-visual-inertial estimator for challenging environments
제가 이 논문을 읽어보게 된 이유는, 이전에 리뷰한 논문과 마찬가지로 여러 센서를 퓨전하여 이용할 때, 각 센서들의 문제가 생길 경우 어떻게 해결할 수 있는지를 찾아보기…
[ECCV 2022] PT4AL: Using Self-Supervised Pretext Tasks for Active Learning
저는 최근 Self-supervised Learning (이하 SSL)과 Active Learning(이하 AL) 을 결합한 논문에 대해 리뷰를 한 적이 있는데요, 오늘 리뷰하려는 논문 역시 SSL+AL 에 대한 연구입니다….
[arXiv 2021] Cross-modality fusion transformer for multispectral object detection
Cross-modality fusion transformer 안녕하세요. 두 번째 X-Review 글입니다. 이번 논문은 IPIU 2023을 준비하며 읽은 논문으로, 이전 세미나를 준비하며 Attention is all you need와 An Image…
[ICCV 2019] CCNet : Criss-Cross Attention for Semantic Segmentation
안녕하세요.오늘 리뷰 할 논문은 CCNet 이라고 하는 segmentation model로써,Semantic Segmentation을 수행하는 논문인데, Attention 기법을 활용한 모델을 제안합니다. 현재 Semantic Segmentation 관련 실험을 진행중인데, 기존 baseline에서…
[CVPR2021] Reducing Domain Gap by Reducing Style Bias
이번에 소개할 논문은 CVPR2021에 게제된 SagNet이라는 방법론입니다. 해당 논문의 분야는 Domain Adaptation 분야로 간략하게 컨셉을 요약하면 Style에 강인한 네트워크를 학습시켜서 domain shift로 인해 발생하는 성능…
[ArXiv 2022] Temporal Sentence Grounding in Videos: A Survey and Future Directions
안녕하세요. 이번 주차 X-Review는 ‘Temporal Sentence Grounding in Videos’ task (이하 TSGV)에 대한 전반적인 서베이 내용으로 준비했습니다. 내년부터 ETRI 과제가 text와 video를 함께 사용하는 방향으로…
최신 댓글