[CVPR 2022] Balanced Multimodal Learning via On-the-fly Gradient Modulation
Introduction 우리가 익히 알고 있듯, 사람은 시각, 청각, 촉각 등 여러 감각 기관을 사용하여 세상을 인지합니다. 이러한 방식에 영감을 받아 머신 러닝 분야에서는 다양한 센서로부터…
[ICCV2023]UniVTG: Towards Unified Video-Language Temporal Grounding
안녕하세요. 박성준입니다. 오늘 제가 리뷰할 논문은 ICCV2023에 개제된 UniVTG입니다. 해당 논문은 3가지 task를 통합한 Unified 프레임워크를 제시하며 Moment Retrieval, Highlight Detection, Video Summarization에서 좋은 성능을…
[WACV 2021] Multi-Loss Weighting with Coefficient of Variations
안녕하세요. 이번에는 loss와 관련한 논문을 들고와봤습니다. 제가 이번에 진행하는 실험에서 계속 loss가 불안정하다는 것을 발견하고 굉장히 나이브하게 weight를 주는 실험을 진행해봤는데요. 정말 꿈쩍도 안하는 성능이…
[ICCV 2019] Active Learning for Deep Detection Neural Networks
Object Detection을 위한 Active Learning 을 수행한 초창기 논문에 대해 리뷰해보려고 합니다. Active Learning이라는 연구에서는 대부분이 Classification 위주로 진행되고 있습니다. 그러나 실제 산업계에서는 Classification 보단,…
AAAI 2024 참관기
2022년 7월 정도에 시작 됐던 연구가 드디어 AAAI 2024에 개제를 승인받았습니다. 그 이전에도 IEEE Access에 두 번 accept을 받은 적이 있지만, 인공지능분야 탑 티어 학회는 그 감동이 배가 되어 전달되더군요. 그래서…
[CVPR2024] DepthAnything: Unleashing the Power of Large-Scale Unlabeled Data
이번에 소개 드릴 논문은 DepthAnything이라는 논문입니다. 논문 및 코드가 공개된지는 몇개월 됐지만 지난 2월 26일날에 CVPR accept list가 공개되면서 본 논문도 CVPR2024에 게재된 것이 확인됐네요….
[NIPS 2023w] An Information-Theoretic Understanding of Maximum Manifold Capacity Representations
이 논문의 주요 키워드 Representation Learning Self-supervised Learning 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. MMCR에 대한 이해 (MMCR 리뷰) Self-supervised representation learning에 대한 이해…
[CVPR 2024] YOLO-World: Real-Time Open-Vocabulary Object Detection
안녕하세요. 이번 리뷰는 YOLO (You Only Look Once)를 베이스로 한 Open-Vocabulary Object Detection (통칭 OVD) 연구입니다. Arxiv에 며칠 전까지 수정된 따끈따끈한 논문이네요. 지난 리뷰에서 새로운…
AAAI-24 학회 참관기
안녕하세요, 오늘은 저번 주 다녀왔던 2024년도 AAAI 학회 참관기를 작성해보겠습니다. 우선 저희 팀은 이번 AAAI에 <VVS: Video-to-Video Retrieval with Irrelevant Frame Suppression> 논문이 accept되어 참석하게…
[2024-동계][이우진] URP를 마치며
안녕하세요. 저는 2024년 동계 URP를 이수한 인공지능학과 22학번 이우진입니다. URP 과정을 8주 동안 무사히 완수하였고 저도 지원할 때 이러한 후기를 보고 많은 도움이 됐기에 저도…
안녕하세요 질문 남겨주셔서 감사합니다 논문에서는 CTR 데이터에 대한 결과와 비교하면서 STR의 경우 이미지 내 텍스트가 갖는 특징 자체가 보다 덜…