Posted in X-Review

[CVPR 2022]RegionCLIP: Region-based Language-Image Pretraining

안녕하세요. 두 번째 X-Review로 소개드릴 논문은 RegionCLIP: Region-based Language-Image Pretraining으로 2022년 CVPR에 게재된 논문입니다. 이 논문은 제가 OVOD(Open-Vocabulary Object Detection) 관련 연구들을 처음 접하고 공부하던…

Continue Reading
Posted in Paper X-Review

[CVPR 2025] SharpDepth: Sharpening Metric Depth Predictions Using Diffusion Distillation

안녕하세요, 67번째 x-review 입니다. 이번 논문은 CVPR 2025년도에 게재된 diffusion 기반 depth estimation 논문 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction Monocular Depth Estimation(MDE)는…

Continue Reading
Posted in Paper X-Review

[ICLR 2023]SPARSE UPCYCLING: TRAINING MIXTURE-OF-EXPERTS FROM DENSE CHECKPOINTS

안녕하세요. 이번에 소개할 논문도 MoE 분야의 연구입니다. 이 논문은 기존 dense 모델을 MoE 모델로 확장하는 과정에서, MoE 레이어의 전문가 네트워크(expert)를 단순히 랜덤으로 초기화해 학습하는 것이…

Continue Reading
Posted in Paper X-Review

[NerulPS 2017] Attention is all you need

안녕하세요 제 두번째 X-review로는 Transformer 를 작성하려고 합니다.이전에 잘 작성해주신 글들이 많지만, 서로 표현하는 방법이나 생각하는 것들이 조금씩 다를 수 있으니 이후 읽을 사람에게 생각의…

Continue Reading
Posted in News X-Review

[CVPR2023]SCANet: Self-Paced Semi-Curricular Attention Network for Non-Homogeneous Image Dehazing

안녕하세요 2번째 X-Review 작성자 손우진입니다. 이번에는 2023년 CVPR에 기재된 Non-Homogeneous Image에서 Dehazing 문제를 다룬 논문인 SCANet: Self-paced Semi-curricular Attention Network for Non-Homogeneous Image Dehazing 을…

Continue Reading
Posted in Paper X-Review

[TPAMI2023] SC-DepthV3: Robust Self-supervised Monocular Depth Estimation for Dynamic Scenes

오랜만에 쓰는 x리뷰입니다. 감을 잡을 겸 예전부터 익숙했던 분야의 논문을 읽고 리뷰해보았습니다. TPAMI2023에 나온 논문이고 제목에서 V3라고 되어있는데 V1은 IJCV, V2는 TPAMI2022에 붙은 논문으로 방향성을…

Continue Reading
Posted in X-Diary

ICRA 2025 참관 후기

안녕하세요. 지난 일주일 (19-23) 간, 미국 애틀랜타의 ICRA 2025 학회를 참관하고 느낀 점을 연구원 분들과 공유드리고자 합니다. 우리가 흔히들 말하는 CVPR/ICCV 등 주요 학회의 논문은…

Continue Reading
Posted in Paper X-Review

[arXiv 2025] Real2Render2Real: Scaling Robot Data Without Dynamics Simulation or Robot Hardware

이번 리뷰 논문은 로봇 러닝 측면에서 하고 싶었던 방향을 구현한 기법으로, 실제 로봇이 없이 그리고 동적인 시뮬레이션에 대한 구축 없이 학습 데이터를 생성하는 방법을 제시한…

Continue Reading
Posted in Paper X-Review

[arXiv2025]Video Summarization with Large Language Models

대형 언어 모델(LLMs)을 비디오 요약에 활용하는 기본적인 접근법이 어떻게 될까요?저는 위 질문에 대해 답을 찾기 위해 해당 논문을 읽게 되었습니다. 직관적인 제목처럼 제가 보았던 논문중에서…

Continue Reading
Posted in X-Review

[ICLR 2024] Online Continual Learning For Interactive Instruction Following Agents

안녕하세요. 이번 논문은 Online Continual Learning, 즉 Incremental Learning 과 관련된 논문입니다. 특히 embodied agent 혹은 로봇 에이전트를 그 대상으로 두고, 앞으로 이 agent가 세상을…

Continue Reading