Category: X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in Paper X-Review

[ArXiv 2024] CLII: Visual-Text Inpainting via Cross-Modal Predictive Interaction

안녕하세요, 쉰 다섯번째 X-Review입니다. 이번 논문은 2024년도 ArXiv에 올라온 CLII: Visual-Text Inpainting via Cross-Modal Predictive Interaction논문입니다. 바로 시작하도록 하겠습니다. ?? 1. Introduction 도시 거리에는 광고판이나,…

Continue Reading
Posted in Paper X-Review

[CVPR 2022] Learning to Prompt for Open-Vocabulary Object Detection with Vision-Language Model

안녕하세요, 허재연입니다. 요즘에는 VLM과 OD의 결합으로 발전되고 있는 OVOD의 연구 동향을 팔로업 하고 있습니다. 제가 NLP쪽은 잘 몰라서 VLM의 prompt는 어떻게 사용하는지 항상 의문을 가지고…

Continue Reading
Posted in X-Review

[ECCV 2024] Feature Splatting: Language-Driven Physics-Based Scene Synthesis and Editing

안녕하세요 이번주에는 미니 챌린지 도중 3D Gaussian Splatting에 추가적인 feature들을 추가로 넣어서 사용해보고자 feature splatting 논문을 읽어보았습니다. Introduction 낙엽의 움직임을 통해 보이지 않는 바람의 존재를…

Continue Reading
Posted in Paper X-Review

[CoRL 2024] D3RoMA: Disparity Diffusion-based Depth Sensing for Material-Agnostic Robotic Manipulation

안녕하세요, 57번째 x-review 입니다. 이번 논문은 CoRL 2024년도에 게재된 논문 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction 스테레오 카메라를 통해 구해지는 depth map은 노이즈와…

Continue Reading
Posted in Paper X-Review

[TPAMI 2025] VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization

안녕하세요, 쉰 네번째 X-Review입니다. 이번 논문은 2025년도 TPAMI에 게재된 VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization 논문입니다. 바로 시작하도록…

Continue Reading
Posted in X-Review

[CoRL 2024] ReKep: Spatio-Temporal Reasoning of Relational Keypoint Constraints for Robotic Manipulation

안녕하세요. 이번 리뷰도 태스크별 대규모 로봇-액션 데이터를 이용한 학습이나, 환경 모델에 기반한 강화학습없이, VLM+LVM 를 활용하여 free form language instruction이 들어왔을 때 python action code…

Continue Reading
Posted in X-Review

[arXiv 2025] RE3SIM: Generating High-Fidelity Simulation Data via 3D-Photorealistic Real-to-Sim for Robotic Manipulation

안녕하세요 이번주에는 3D reconstruction과 neural rendering을 활용한 엄청나게 현실적인 real-to-sim 시스템에 대해서 리뷰해보도록 하겠습니다. Introduction 실제 환경에서 전문가의 Teleoperation을 통한 데이터 수집은 뛰어난 일반화 능력이…

Continue Reading
Posted in Paper X-Review

[NeurIPS2025]Enhancing Semi-Supervised Learning via Representative and Diverse Sample Selection

오늘 소개 드릴 논문은 제목에서와 같이 Diversity(다양성)와 Representative(대표성)를 동시에 고려하는 고가치 데이터 선별 방법에 관한 논문입니다. 두 지표는 Coresets[arxiv]과 같은 기존 Active Learning 연구에서 자주…

Continue Reading
Posted in Paper X-Review

[ArXiv 2024] InstructOCR: Instruction Boosting Scene Text Spotting

안녕하세요, 쉰 세번째 X-Review입니다. 이번 논문은 2024년도 ArXiv에 올라온 InstructOCR: Instruction Boosting Scene Text Spotting논문입니다. 바로 시작하도록 하겠습니다. ? 1. Introduction 최근 vision과 text를 함께…

Continue Reading
Posted in Paper X-Review

[AAAI 2025] Zero-shot Depth Completion via Test-time Alignment with Affine-invariant Depth Prior

안녕하세요, 56번째 x-review 입니다. 이번 논문은 AAAI 2025년도에 게재된 depth completion 논문으로, 제가 이전에 리뷰한 Marigold를 활용한 방법론 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1….

Continue Reading