X-Review – Page 95 – Robotics and Computer Vision Lab

[ICASSP 2023] Knowledge-Aware Bayesian Co-Attention for Multimodal Emotion Recognition

안녕하세요. 최근에 VQA 논문 리뷰하다가 다시 감정 인식 논문으로 돌아왔습니다. 이전에 external knowledge를 이용하여 ERC를 수행했던 논문을 읽은 경험이 있어서 multimodal emotion recognition 논문 중에서…

Paper X-Review

[CVPR 2023] Devil’s on the Edges : Selective Quad Attention for Scene Graph Generation

Before Review 제가 KCCV 2023에 참석하면서 알게 된 논문 입니다. 그전에도 알고 있긴 했지만 구체적인 내용은 몰랐고 이번 KCCV 다녀오면서 저자에게 직접 설명을 들으면서 궁금한…

X-Review

[AAAI 2023] Self-Supervised Video Representation Learning via Latent Time Navigation

오늘은 시간적 정보를 가이드하는 부분을 포함해서 학습하는 SSL 논문을 가져왔습니다. Introduction Temporal한 정보가 Video에 도움이 되는지 되지 않는지에 대한 많은 연구들이 있습니다. 어떻게 학습을 하는지에…

Paper X-Review

[CVPR 2023] Revisiting Temporal Modeling for CLIP-based Image-to-Video Knowledge Transfering

이런 분들께 이 논문을 추천드립니다. Image-Text 모델인 CLIP을 Video Understanding에 활용하는 방법이 궁굼하신 분 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. CLIP에 대한 이해 (CLIP…

Paper X-Review

[CVPR2022]Active Teacher for Semi-Supervised Object Detection

[go to paper: pdf] 본 논문의 주제인 Active Teacher는 무엇인가요? Active Teacher란 active learning의 특징처럼 “주기적인 학습”을 하며 “teacher-student 구조를 갖는” 형태의 학습을 의미합니다. 즉,…

X-Review

[BMVC 2021] 2.5D-VoteNet: Depth Map based 3D object detection for real-time applications

본 논문에서는 depth map에서 2d cnn을 이용해 direct하게 feature를 포착하여 3d object detection을 하는 task를 제안한다. input은 3d point cloud가 아니라 2d로 누른 depth map을…

Paper X-Review

[ECCV 2022] Prompting Visual-Language Models for Efficient Video Understanding

안녕하세요. 이번 주에 리뷰할 논문은 22년도 ECCV에 게재된 <Prompting Visual-Language Models for Efficient Video Understanding>입니다. 논문 제목에서의 Video Understanding은 보통 비디오를 다루는 모든 task를 통칭하며…

News Paper X-Review

[AAAI 2018] LSTD: A Low-Shot Transfer Detector for Object Detection

안녕하세요. 열 아홉번째 x-review입니다. 이번에 작성하는 리뷰는 최근 연구에 대해 고민하던 도중 김남일 연구원님의 연사를 듣고 흥미있어지게 된, 그러면서 권석준 연구원이 발표한 KCCV 모교수님의 “Top-down…

Paper X-Review

[CVPR2020] On Recognizing Texts of Arbitrary Shapes with 2D Self-Attention

안녕하세요. 열 한 번째 X-Review입니다. 금주 리뷰할 논문은 CVPR 2020에 게재된 <On Recognizing Texts of Arbitrary Shapes with 2D Self-Attention>입니다. 그럼 바로 리뷰 시작하겠습니다. ! 1….

Paper X-Review

[CVPR 2022] TransFusion: Robust LiDAR-Camera Fusion for 3D Object Detection with Transformers

안녕하세요, 열한번째 x-review 입니다. 이번 논문은 CVPR 2022에 게재된 TransFusion으로 outdoor scene에서 RGB image와 point cloud를 fusion한 3D Object Deteciton 방법론 입니다. 그럼 바로 리뷰…

Category: X-Review

[ICASSP 2023] Knowledge-Aware Bayesian Co-Attention for Multimodal Emotion Recognition

[CVPR 2023] Devil’s on the Edges : Selective Quad Attention for Scene Graph Generation

[AAAI 2023] Self-Supervised Video Representation Learning via Latent Time Navigation

[CVPR 2023] Revisiting Temporal Modeling for CLIP-based Image-to-Video Knowledge Transfering

[CVPR2022]Active Teacher for Semi-Supervised Object Detection

[BMVC 2021] 2.5D-VoteNet: Depth Map based 3D object detection for real-time applications

[ECCV 2022] Prompting Visual-Language Models for Efficient Video Understanding

[AAAI 2018] LSTD: A Low-Shot Transfer Detector for Object Detection

[CVPR2020] On Recognizing Texts of Arbitrary Shapes with 2D Self-Attention

[CVPR 2022] TransFusion: Robust LiDAR-Camera Fusion for 3D Object Detection with Transformers

Conference Deadline

NEW POST

New Comment