X-Review – Page 78 – Robotics and Computer Vision Lab

[CVPR 2022] Balanced Multimodal Learning via On-the-fly Gradient Modulation

Introduction 우리가 익히 알고 있듯, 사람은 시각, 청각, 촉각 등 여러 감각 기관을 사용하여 세상을 인지합니다. 이러한 방식에 영감을 받아 머신 러닝 분야에서는 다양한 센서로부터…

[ICCV2023]UniVTG: Towards Unified Video-Language Temporal Grounding

안녕하세요. 박성준입니다. 오늘 제가 리뷰할 논문은 ICCV2023에 개제된 UniVTG입니다. 해당 논문은 3가지 task를 통합한 Unified 프레임워크를 제시하며 Moment Retrieval, Highlight Detection, Video Summarization에서 좋은 성능을…

X-Review

[WACV 2021] Multi-Loss Weighting with Coefficient of Variations

안녕하세요. 이번에는 loss와 관련한 논문을 들고와봤습니다. 제가 이번에 진행하는 실험에서 계속 loss가 불안정하다는 것을 발견하고 굉장히 나이브하게 weight를 주는 실험을 진행해봤는데요. 정말 꿈쩍도 안하는 성능이…

Paper X-Review

[ICCV 2019] Active Learning for Deep Detection Neural Networks

Object Detection을 위한 Active Learning 을 수행한 초창기 논문에 대해 리뷰해보려고 합니다. Active Learning이라는 연구에서는 대부분이 Classification 위주로 진행되고 있습니다. 그러나 실제 산업계에서는 Classification 보단,…

Conference Paper X-Review

[CVPR2024] DepthAnything: Unleashing the Power of Large-Scale Unlabeled Data

이번에 소개 드릴 논문은 DepthAnything이라는 논문입니다. 논문 및 코드가 공개된지는 몇개월 됐지만 지난 2월 26일날에 CVPR accept list가 공개되면서 본 논문도 CVPR2024에 게재된 것이 확인됐네요….

Paper X-Review

[NIPS 2023w] An Information-Theoretic Understanding of Maximum Manifold Capacity Representations

이 논문의 주요 키워드 Representation Learning Self-supervised Learning 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. MMCR에 대한 이해 (MMCR 리뷰) Self-supervised representation learning에 대한 이해…

Paper X-Review