X-Review – Page 53 – Robotics and Computer Vision Lab

[ICIP 2023] TR3D: TOWARDS REAL-TIME INDOOR 3D OBJECT DETECTION

안녕하세요. 저번 주차에 FCAF3D 라는 Fully Convolutional 3D object detection 방법론 중 anchor-free 기법을 처음으로 제안한 논문을 리뷰했었습니다. FCAF3D에 대한 리뷰가 궁금하신 분들은 저의 리뷰…

Paper X-Review

[CVPR 2021] UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

안녕하세요, 허재연입니다. 오늘 리뷰할 논문은 CVPR 2021 및 TPAMI 2022에 게재된 UP-DETR이라는 논문으로, DETR에 대한 unsupervised learning을 다룬 논문입니다. 리뷰 시작하겠습니다. Introduction Self-Supervised Learning, Unsupervised…

Conference X-Review

[CVPR 2024] OMG-Seg: Is One Model Good Enough For All Segmentation?

안녕하세요. Vision 분야에서 Recognition에 대해 Detection에 대해 연구를 하고, 최근에는 Segmentation 분야에 대해 관심을 가지고 있습니다. 제 생각에선 Detection이든, Segmentation이든, 그 어떤 Task이든 연구와 실용성의…

X-Review

[CVPR 2022] Grounded Language-Image Pre-training

지난번 리뷰에서 Grounding DINO 라는 최신 VLM 모델에 대해 다루면서, GLIP이라는 방법론을 간단하게 설명했었습니다. 단순하게 다루고 넘어가기엔, 어찌보면 CLIP 이후로 등장한 VLM의 근본이 되는 그런…

Paper X-Review

[CVPR 2022] DETReg: Unsupervised Pretraining with Region Priors for Object Detection

안녕하세요, 허재연입니다. 오늘 리뷰할 논문은 DETReg라는 Self-Supervised Learning 방법론을 제안한 논문입니다. SSL 중에서도 특히 Object Detection을 염두한 논문으로, Detector로 DETR을 사용합니다. 리뷰 시작하도록 하겠습니다. Introduction…

X-Review

[ICASSP 2024]Enhancing Two-Stage Finetuning for Speech Emotion Recognition Using Adapters

Introduction Speech Emotino Recognition은 사용자의 음성에서 감정을 인식하는 task로, SER 기술은 Human-computer Interaction 분야에서 사용자 친화적인 환경을 구축하기 위해 사용된다고 합니다. 초기 SER 연구에서는 supervised…

X-Review

[ECCV 2022] FCAF3D: Fully Convolutional Anchor-Free 3D Object Detection

안녕하세요. 이번 리뷰는 저희 로보틱스 팀 기초교육의 일환으로 공부 중인 3D detection task 관련 논문입니다. 사실 TR3D 논문을 읽고 그에 대한 코드 원복과 성능 개선을…

Paper X-Review

[2024 CVPR] From Pixels to Graphs: Open-Vocabulary Scene Graph Generation with Vision-Language Models

안녕하세요 이번 리뷰에서는 Scene Graph Generation (SGG) 분야의 논문을 다뤄보고자 합니다. 이전의 SGG 연구들은 주로 closed set 상황에서 발생하는 문제, long-tailed data bias 및 라벨링…

Conference X-Review

[ICCP 2024] ThermalNeRF: Thermal Radiance Fields

이번 리뷰 논문은 열화상과 컬러 영상에서의 Novel View Synthesis를 제안한 논문입니다. 해당 연구 결과는 열화상과 컬러 영상 간의 도메인 갭을 메꾸기 위한 기반이 될 연구라고…

Paper X-Review

[NeurIPS 2024] Emotion and Intent Joint Understanding in Multimodal Conversation: A Benchmarking Dataset

pdf Code&Dataset 안녕하세요. 이번에는 새로운 Benchmarking Dataset을 제안하는 MC-EIU 논문을 가져와봤습니다. 최근에 EMER이라는 task를 알게 되면서 해당 task를 제안한 교수님의 사이트를 계속해서 팔로업하고 있는데 교수님께서…

Category: X-Review

[ICIP 2023] TR3D: TOWARDS REAL-TIME INDOOR 3D OBJECT DETECTION

[CVPR 2021] UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

[CVPR 2024] OMG-Seg: Is One Model Good Enough For All Segmentation?

[CVPR 2022] Grounded Language-Image Pre-training

[CVPR 2022] DETReg: Unsupervised Pretraining with Region Priors for Object Detection

[ICASSP 2024]Enhancing Two-Stage Finetuning for Speech Emotion Recognition Using Adapters

[ECCV 2022] FCAF3D: Fully Convolutional Anchor-Free 3D Object Detection

[2024 CVPR] From Pixels to Graphs: Open-Vocabulary Scene Graph Generation with Vision-Language Models

[ICCP 2024] ThermalNeRF: Thermal Radiance Fields

[NeurIPS 2024] Emotion and Intent Joint Understanding in Multimodal Conversation: A Benchmarking Dataset

Conference Deadline

NEW POST

New Comment