[일:] 2025년 05월 26일

Posted in Conference X-Review

[ICRL 2025] Weakly-Supervised Affordance Grounding Guided by Part-Level Semantic Priors

Abstract 저자들은 Human Object Intereation 이미지(=exocentric 이미지)와 물체 중심의 이미지(=egocentric 이미지)를 weakly supervised 방식으로 학습하는 affordance grounding 연구를 제안합니다. 기존 연구는 affordance 카테고리에 대한 activation…

Continue Reading
Posted in Paper X-Review

[NeurIPS 2023] Zero-shot Visual Relation Detection via Composite Visual Cues from Large Language Models

안녕하세요, 허재연입니다. 지난번에 이어서 OV-SGG 분야 논문을 가져왔습니다. SGG의 경우 일반적으로 <subject-predicate-object> triplet을 모두 잘 예측하고자 하는 흐름에 있는데(이를 Visual Relation Detection이라고도 합니다), 본 논문은…

Continue Reading
Posted in Paper X-Review

[ACM 2022] Reading and Writing: Discriminative and Generative Modeling for Self-Supervised Text Recognition

안녕하세요 류지연입니다. TESTR과 DPText-DETR에 이어서 텍스트 인식 task에 집중하며 논문을 읽고 교육받고 있습니다. 당분간은 이와 관련해서 리뷰를 작성할 듯 싶습니다. 이번에는 Text Recognition만을 다룬 연구인…

Continue Reading
Posted in Conference X-Review

[CVPR 2025] MultiVENT 2.0: A Massive Multilingual Benchmark for Event-Centric Video Retrieval

새로운 Video Retrieval 데이터셋과 관련된 논문이 있어 리뷰해보겠습니다. Conference: CVPR 2025 Authors: Reno Kriz, Kate Sanders, David Etter, Kenton Murray, Cameron Carpenter, Kelly Van Ochten, Hannah…

Continue Reading
Posted in X-Review

[CoRL 2024] Robot See Robot Do: Imitating Articulated Object Manipulation with Monocular 4D Reconstruction

안녕하세요, 지난주에는 scene을 3D로 복원한 뒤 이를 기반으로 효율적인 학습을 수행하는 논문을 리뷰했는데요, 이번에는 그보다 한 단계 더 나아가 시간 축을 포함한 4D 정보를 복원하여…

Continue Reading