[월:] 2025년 05월
[TPAMI 2025] Instruction-Guided Scene Text Recognition
안녕하세요, 쉰 아홉번째 X-Review입니다. 이번 논문은 2025년도 TPAMI에 올라온 Instruction-Guided Scene Text Recognition논문입니다. 바로 시작하도록 하겠습니다. 🫎 1. Introduction Scene Text Recognition은 scene image내의 text를…
[arXiv 2025.02] Token Pruning in Multimodal Large Language Models: Are We Solving the Right Problem?
이 상인 05/05/2025 [arXiv 2025.02] Token Pruning in Multimodal Large Language Models: Are We Solving the Right Problem?에 댓글 6개
안녕하세요. 이번에는 MLLM의 Token Pruning에 대한 분석을 담은 논문을 들고 왔습니다. 본 논문을 읽게 된 계기가 참 긴데, 현재 제가 진행 중인 실험과 연관되어 있습니다….
[CVPR 2025] Video-ColBERT: Contextualized Late Interaction for Text-to-Video Retrieval
홍 주영 05/05/2025 [CVPR 2025] Video-ColBERT: Contextualized Late Interaction for Text-to-Video Retrieval에 댓글 6개
오늘도 Video-Text Retrieval 논문에 대해 리뷰해보겠습니다. Conference: CVPR 2025 Authors: Arun Reddy, Alexander Martin, Eugene Yang, Andrew Yates, Kate Sanders, Kenton Murray, Reno Kriz, Celso M….
Posted in X-Review
[CoRL 2022] BEHAVIOR-1K: A Benchmark for Embodied AI with 1,000 Everyday Activities and Realistic Simulation
김 영규 05/05/2025 [CoRL 2022] BEHAVIOR-1K: A Benchmark for Embodied AI with 1,000 Everyday Activities and Realistic Simulation에 댓글 2개
안녕하세요, 이번주엔 여태까지 진행하던 강화학습 논문들 리뷰를 접어두고 Embodied AI를 위한 벤치마크 논문을 가지고 왔습니다. BEHAVIOR-1K는 comprehensive 한 시뮬레이션 벤치마크로, BEHAVIOR-1K 데이터셋과 OmniGibson이라는 시뮬레이션을 지원한다는…
[arXiv 2025] All-day Depth Completion via Thermal-LiDAR Fusion
안녕하세요, 63번째 x-review 입니다. 이번 논문은 4월 초에 arXiv에 올라온 따끈따끈한 논문으로, depth completion에 열화상을 처음으로 적용한 논문 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1….
최신 댓글