X-Review – Page 34 – Robotics and Computer Vision Lab

[CVPR 2022] DenseCLIP : Language-Guided Dense Prediction with Context-Aware Propmting

안녕하세요, 허재연입니다. 오늘 다룰 논문은 CLIP과 같은 image-text pair로 대규모 사전학습을 진행한 VLM모델들의 지식을 dense prediction task에 효율적으로 전이할 수 있는 방법을 제안한 논문입니다. 제안하는…

Conference X-Review

[CVPR 2025] Narrating the Video: Boosting Text-Video Retrieval via Comprehensive Utilization of Frame-Level Captions

오늘도 Text-Video Retrieval 논문에 대해 리뷰해겠습니다. 리뷰하려는 논문은 CVPR 2025 에 Accept 되었고, Arxiv 버전으로 리뷰를 진행하려고 합니다. Conference: CVPR 2025 Authors: Chan Hur, Jeong-hun Hong,…

X-Review

[AAAI 2016] Deep Reinforcement Learning with Double Q-learning

안녕하세요, 이번주도 저번주에 이어서 강화학습에 딥러닝을 적용한 논문을 리뷰해보도록 하겠습니다. 강화학습에 처음으로 딥러닝을 적용한 DQN이 가지고 있는 Q-value 과대추정(overestimation bias) 문제를 해결하기 위해 제안된 알고리즘입니다….

Paper X-Review

[CVPR 2022] RegionCLIP: Region-based Language-Image Pretraining

안녕하세요 류지연입니다. 오늘 리뷰하려고 가져온 논문은 RegionCLIP입니다. 랩세미나에서 늘 CLIP이 언급돼서 늘 궁금했었는데요 동기 연구원의 기초교육 일정에 RegionCLIP 논문을 읽는 게 있어서 CLIP연구와 함께 기본이…

Paper X-Review

[ICLR 2022] FILIP: FINE-GRAINED INTERACTIVE LANGUAGE-IMAGE PRE-TRAINING

안녕하세요, 허재연입니다. 이번 리뷰에서 다룰 논문은 보다 fine-grained 한 사전학습을 통해 FILIP이라는 새로운 VLM을 구축한 연구입니다. 리뷰 시작하겠습니다. Introduction CLIP, ALIGN과 같은 대규모 Vision-Language 사전학습법이…

X-Review

[ICRA 2017] Learning Modular Neural Network Policies for Multi-Task and Multi-Robot Transfer

안녕하세요. 이번 리뷰도 매니퓰레이터 강화학습에 관한 내용으로 들고 왔습니다. 로봇과 태스크 변화에도 일반화를 보이는 강화학습 기법에 대한 가능성을 풀어나간 논문입니다. 리뷰 시작하겠습니다. 1. Introduction 이게…

X-Review

[CVPR 2019] Learning a Unified Classifier Incrementally via Rebalancing

안녕하세요 박성준 연구원입니다. 오늘 리뷰할 논문은 incremental learning을 다룬 논문입니다. Incremental Learning 인공지능은 대부분 오프라인 학습을 기반으로 설계되어 있습니다. 오프라인 방식은 대량의 데이터를 미리 수집한…

Paper X-Review

[ICCV 2023] A Simple Framework for Open-Vocabulary Segmentation and Detection (OpenSeeD)

안녕하세요, 허재연입니다. 이번 리뷰에서는 다룰 논문은 OpenSeeD라는, Open Vocabulary Segmentation과 Detection를 둘 다 수행할 수 있는 프레임워크를 제안한 논문입니다. 리뷰 시작하도록 하겠습니다. Introduction 대표적인 대규모…

Conference X-Review

[CVPR 2023] Clover : Towards A Unified Video-Language Alignment and Fusion Model

Video-Language understanding 연구에 대해 리뷰해보겠습니다. Conference: CVPR 2023 Authors: Jingjia Huang, Yinan Li, Jiashi Feng, Xinglong Wu, Xiaoshuai Sun, Rongrong Ji Affiliation: Key Laboratory of Multimedia…

Paper X-Review

[arXiv 2025] Cooking Task Planning using LLM and Verified by Graph Network

이번 리뷰 논문의 유뷰트 보고 요리하는 로봇에 대해서 다루고자 합니다. 분야 관련 게시물들을 보다가 발견한 기사에서 해당 논문에 대해서 다루는 것을 보고 읽게 되었습니다. 기법은…

Category: X-Review

[CVPR 2022] DenseCLIP : Language-Guided Dense Prediction with Context-Aware Propmting

[CVPR 2025] Narrating the Video: Boosting Text-Video Retrieval via Comprehensive Utilization of Frame-Level Captions

[AAAI 2016] Deep Reinforcement Learning with Double Q-learning

[CVPR 2022] RegionCLIP: Region-based Language-Image Pretraining

[ICLR 2022] FILIP: FINE-GRAINED INTERACTIVE LANGUAGE-IMAGE PRE-TRAINING

[ICRA 2017] Learning Modular Neural Network Policies for Multi-Task and Multi-Robot Transfer

[CVPR 2019] Learning a Unified Classifier Incrementally via Rebalancing

[ICCV 2023] A Simple Framework for Open-Vocabulary Segmentation and Detection (OpenSeeD)

[CVPR 2023] Clover : Towards A Unified Video-Language Alignment and Fusion Model

[arXiv 2025] Cooking Task Planning using LLM and Verified by Graph Network

Conference Deadline

NEW POST

New Comment