[월:] 2025년 04월
[arXiv 2025] Video-T1: Test-Time Scaling for Video Generation
안녕하세요 지금부터 비디오 생성의 퀄리티를 높이기 위해 Test-Time Scaling(TTS)을 어떻게 적용하는지를 다룬 논문을 소개하겠습니다. Test-Time Scaling은 추론 단계(test-time)에서 연산량과 같은 리소스를 확장(scaling)하여 예측의 품질을 개선하는…
[CVPR 2022] DenseCLIP : Language-Guided Dense Prediction with Context-Aware Propmting
안녕하세요, 허재연입니다. 오늘 다룰 논문은 CLIP과 같은 image-text pair로 대규모 사전학습을 진행한 VLM모델들의 지식을 dense prediction task에 효율적으로 전이할 수 있는 방법을 제안한 논문입니다. 제안하는…
[CVPR 2025] Narrating the Video: Boosting Text-Video Retrieval via Comprehensive Utilization of Frame-Level Captions
오늘도 Text-Video Retrieval 논문에 대해 리뷰해겠습니다. 리뷰하려는 논문은 CVPR 2025 에 Accept 되었고, Arxiv 버전으로 리뷰를 진행하려고 합니다. Conference: CVPR 2025 Authors: Chan Hur, Jeong-hun Hong,…
[AAAI 2016] Deep Reinforcement Learning with Double Q-learning
안녕하세요, 이번주도 저번주에 이어서 강화학습에 딥러닝을 적용한 논문을 리뷰해보도록 하겠습니다. 강화학습에 처음으로 딥러닝을 적용한 DQN이 가지고 있는 Q-value 과대추정(overestimation bias) 문제를 해결하기 위해 제안된 알고리즘입니다….
[CVPR 2022] RegionCLIP: Region-based Language-Image Pretraining
안녕하세요 류지연입니다. 오늘 리뷰하려고 가져온 논문은 RegionCLIP입니다. 랩세미나에서 늘 CLIP이 언급돼서 늘 궁금했었는데요 동기 연구원의 기초교육 일정에 RegionCLIP 논문을 읽는 게 있어서 CLIP연구와 함께 기본이…
[ICLR 2022] FILIP: FINE-GRAINED INTERACTIVE LANGUAGE-IMAGE PRE-TRAINING
안녕하세요, 허재연입니다. 이번 리뷰에서 다룰 논문은 보다 fine-grained 한 사전학습을 통해 FILIP이라는 새로운 VLM을 구축한 연구입니다. 리뷰 시작하겠습니다. Introduction CLIP, ALIGN과 같은 대규모 Vision-Language 사전학습법이…
[ICRA 2017] Learning Modular Neural Network Policies for Multi-Task and Multi-Robot Transfer
안녕하세요. 이번 리뷰도 매니퓰레이터 강화학습에 관한 내용으로 들고 왔습니다. 로봇과 태스크 변화에도 일반화를 보이는 강화학습 기법에 대한 가능성을 풀어나간 논문입니다. 리뷰 시작하겠습니다. 1. Introduction 이게…
[CVPR 2019] Learning a Unified Classifier Incrementally via Rebalancing
안녕하세요 박성준 연구원입니다. 오늘 리뷰할 논문은 incremental learning을 다룬 논문입니다. Incremental Learning 인공지능은 대부분 오프라인 학습을 기반으로 설계되어 있습니다. 오프라인 방식은 대량의 데이터를 미리 수집한…
[ICCV 2023] A Simple Framework for Open-Vocabulary Segmentation and Detection
안녕하세요, 허재연입니다. 이번 리뷰에서는 다룰 논문은 OpenSeeD라는, Open Vocabulary Segmentation과 Detection를 둘 다 수행할 수 있는 프레임워크를 제안한 논문입니다. 리뷰 시작하도록 하겠습니다. Introduction 대표적인 대규모…
[CVPR 2023] Clover : Towards A Unified Video-Language Alignment and Fusion Model
Video-Language understanding 연구에 대해 리뷰해보겠습니다. Conference: CVPR 2023 Authors: Jingjia Huang, Yinan Li, Jiashi Feng, Xinglong Wu, Xiaoshuai Sun, Rongrong Ji Affiliation: Key Laboratory of Multimedia…
최신 댓글