Posted in X-Review

[NIPS2016] Unifying Count-Based Exploration and Intrinsic Motivation

안녕하세요 박성준 연구원입니다. 오늘은 강화학습 리뷰를 가져왔습니다. 해당 논문은 알파고로 유명한 구글 딥마인드 팀에서 작성한 논문으로 기존 강화학습에 딥러닝을 연계한 DQN 모델에 관한 내용입니다. 리뷰에…

Continue Reading
Posted in Conference Paper X-Review

[arXiv 2024] π0: A Vision-Language-Action Flow Model for General Robot Control

이번 리뷰 논문은 VLA 논문으로 지능형 로봇을 선두하고 있는 기관 중 Physical Intelligence라는 곳에서 공개한 기법입니다. 최근 VLA의 흐름은 사전 학습된 VLM 모델에 Diffusion policy를…

Continue Reading
Posted in Paper X-Review

[WACV 2022] Occlusion-Robust Object Pose Estimation with Holistic Representation

안녕하세요 류지연입니다. 이번에도 6D 자세 추정에 대한 논문으로 가져왔습니다. 앞서 리뷰했던 PVNet, PVN3D, FFB6D 논문에서의 연구방향과 흐름을 살펴보았을 때 자세추정을 위해 키포인트를 검출할 때 Depth…

Continue Reading
Posted in Conference X-Review

[ICLR 2024(Oral)] ASID: Active Exploration for System Identification in Robotic Manipulation

제가 이번에 리뷰할 논문은 강화학습 관련 논문으로, 저희 팀에서 진행하고 있는 미니프로젝트 3단계를 위해 읽게 된 논문입니다. 3단계 목표는 복잡한 작업을 실행하는 것을 목표로 하며,…

Continue Reading
Posted in X-Review

[NIPS 2013]Playing Atari with Deep Reinforcement Learning

안녕하세요 이번 논문은 Q Learning의 Q값을 Regression하는 DQN(Deep Q Network)를 적용해서 게임을 하는 강화학습 논문 입니다. DNN과 RL을 결합하는 최초의 시도는 아니지만 정말 의미있는 수준의…

Continue Reading
Posted in Paper X-Review

[ACM MM 2024] Focus, Distinguish, and Prompt: Unleashing CLIP for Efficient and Flexible Scene Text Retrieval

안녕하세요, 쉰 여섯번째 X-Review입니다. 이번 논문은 2024년도 ACM MM에 올라온 Focus, Distinguish, and Prompt: Unleashing CLIP for Efficient and Flexible Scene Text Retrieval논문입니다. 바로 시작하도록…

Continue Reading
Posted in News Paper X-Review

[2022 NIPS] On the Representation Collapse of Sparse Mixture of Experts

안녕하세요 이번에 소개해드릴 논문도 Mixture of Experts(MoE) 분야와 관련된 연구입니다. 최근 MoE의 내용을 정리하면서, 이 구성 요소 중 라우팅(router)가 핵심적인 역할을 한다는 점을 파악하게 되었습니다….

Continue Reading
Posted in Conference X-Review

[CVPR 2020] End-to-End Learning of Visual Representations from Uncurated Instructional Videos

오늘은 다소 예전 논문을 가져왔습니다. 최근 Video-Text Retrieval 중심으로 서베이를 진행중인데요, 해당 태스크에서 Loss로 많이 사용하는 MIL-NCE (Multiple Instance Learning and Noise Contrastive Estimation)를 제안한…

Continue Reading
Posted in Paper X-Review

[arXiv 2025] DepthMaster: Taming Diffusion Models for Monocular Depth Estimation

안녕하세요, 60번째 x-review 입니다. 이번 논문은 arXiv 2025에 얼마 전 올라온 DepthMaster라는 논문으로, 제가 요즘 읽고 있는 논문들과 동일하게 Marigold를 기반으로 Monocular Detph Estimation을 수행한…

Continue Reading
Posted in Paper X-Review

[arXiv 2024] LLaVA-PruMerge: Adaptive Token Reduction for Efficient Large Multimodal Models

안녕하세요. 이번 리뷰는 세미나에서 소개드린 LLaVA-PruMerge입니다. 세미나에서 방법론에 대해 자세히 다루지는 않았는데, 좋은 기회일 것 같습니다. 그럼 바로 시작해보겠습니다. Introduction 놀라울만한 LLM의 성능에 이은 LMM…

Continue Reading