X-Review – Page 67 – Robotics and Computer Vision Lab

[ICCV2023]Unified Coarse-to-Fine Alignment for Video-Text Retrieval

안녕하세요. 오늘 다룰 논문은 ICCV 2023의 Unified Coarse-to-Fine Alignment for Video-Text Retrieval(UCoFIA)입니다. CLIP 기반의 text-video task에서 SOTA를 달성했었던 모델입니다. Abstract Moment Retrieval에서 흔히 사용되는 방법…

Paper X-Review

[arXiv 2023] Point-GCC: Universal Self-supervised 3D Scene Pre-training via Geometry-Color Contrast

안녕하세요, 서른 한번째 x-review 입니다. 이번 논문은 2023년도 arXiv에 올라온 Point-GCC: Universal Self-supervised 3D Scene Pre-training via Geometry-Color Contrast입니다. 일년 동안 SUN RGB-D 데이터셋에서 SOTA를…

Paper X-Review

[CVPR 2023] Query-Dependent Video Representation for Moment Retrieval and Highlight Detection

안녕하세요. 이번 주 X-Review에서는 23년도 CVPR에 게재된 <Query-Dependent Video Representation for Moment Retrieval and Highlight Detection>이라는 논문을 소개해드리겠습다. 성균관대 허재필 교수님 연구실에서 나온 논문이며, 해당…

X-Review

[INTERSPEECH 2021] Rethinking Evaluation in ASR: Are Our Models Robust Enough?

이번이 읽은 논문은 Interspeech 2021에서 발표된 “Rethinking Evaluation in ASR: Are Our Models Robust Enough?”논문으로, 음성인식 task에 관한 논문입니다. 음성 모델의 일반화 성능을 올리기 위해…

Paper X-Review

[CVPR 2023] Pooling Revisited: Your Receptive Field is Suboptimal

안녕하세요, 서른세 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 올라온 Pooling Revisited: Your Receptive Filed is Suboptimal입니다. 바로 시작하도록 하겠습니다. ? 1. Introduction Computer vision을 포함한…

News Paper X-Review

[NeurIPS 2020] Bootstrap Your Own Latent A New Approach to Self-Supervised Learning

안녕하세요 정의철 연구원입니다. 제가 이번에 소개할 논문은 ‘Bootstrap Your Own Latent A New Approach to Self-Supervised Learning’이고 흔히 BYOL이라고 불리는 논문입니다. 저는 최근 Self-supervised learning…

Conference X-Review

[3DV 2022(Oral)]PIZZA: A Powerful Image-only Zero-Shot Zero-CAD Approach to 6 DoF Tracking

제가 이번에 리뷰할 논문도 Object Pose Estimation에 관한 논문입니다. 해당 논문의 저자도 제가 이전에 리뷰했던 논문의 저자로, 지난주에 리뷰한 NOPE에서 베이스라인으로 삼았던 논문입니다. Abstract 로보틱스와…

Paper X-Review

[NAACL 2024] Emotion-Anchored Contrastive Learning Framework for Emotion Recognition in Conversation

안녕하세요! 이번에도 ERC 논문입니다. 그런데 멀티모달 논문이 아닌 NLP 논문인데요. 감정 인식 논문을 읽다보면 항상 나오는 ‘유사한 감정은 어떻게 구별할까’에 대한 문제를 주제 있게 다룬…

Paper X-Review

[arXiv 2024] GenFlow: Generalizable Recurrent Flow for 6D Pose Refinement of Novel Objects

안녕하세요, 이번에는 무려 네이버 랩스에서 제안한 unseen object pose estimation의 과정 중 refiner를 다룬 논문을 읽어보았습니다. 생소한 내용도 많아서 읽는 데 상당히 오래 걸렸네요.. BOP…

Paper X-Review

[CVPR 2023] Learning to Generate Language-supervised and Open-vocabulary Scene Graph using Pre-trained Visual-Semantic Space

Before Review 안녕하세요 이번 리뷰도 Scene Graph Generation과 관련된 리뷰를 작성하였습니다. 이번 논문 같은 경우는 Weakly Supervised Learning + Open Vocabulary Learning 상황에서 Scene Graph…

Category: X-Review

[ICCV2023]Unified Coarse-to-Fine Alignment for Video-Text Retrieval

[arXiv 2023] Point-GCC: Universal Self-supervised 3D Scene Pre-training via Geometry-Color Contrast

[CVPR 2023] Query-Dependent Video Representation for Moment Retrieval and Highlight Detection

[INTERSPEECH 2021] Rethinking Evaluation in ASR: Are Our Models Robust Enough?

[CVPR 2023] Pooling Revisited: Your Receptive Field is Suboptimal

[NeurIPS 2020] Bootstrap Your Own Latent A New Approach to Self-Supervised Learning

[3DV 2022(Oral)]PIZZA: A Powerful Image-only Zero-Shot Zero-CAD Approach to 6 DoF Tracking

[NAACL 2024] Emotion-Anchored Contrastive Learning Framework for Emotion Recognition in Conversation

[arXiv 2024] GenFlow: Generalizable Recurrent Flow for 6D Pose Refinement of Novel Objects

[CVPR 2023] Learning to Generate Language-supervised and Open-vocabulary Scene Graph using Pre-trained Visual-Semantic Space

Conference Deadline

NEW POST

New Comment