[카테고리:] X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in Conference X-Review

[WACV 2024] Boosting Weakly Supervised Object Detection using Fusion and Priors from Hallucinated Depth

논문 이름이 꽤 깁니다. 금일 리뷰 하는 논문은 지난 GOOD 논문의 리뷰에 이어, Geometric Cue를 활용한 논문에 대해 읽어보고자 하였습니다. 해당 아이템을 제 논문에 적용하고…

Continue Reading
Posted in News Paper X-Review

[IEEE Transaction 2023] GraSS: Contrastive Learning With Gradient-Guided Sampling Strategy for Remote Sensing Image Semantic Segmentation

안녕하세요 정의철 연구원입니다. 이번 논문은 원격 감지 이미지(RSI:remote sensing image)에서 Self-supervised contrastive learning (SSCL) strategy에 대해 연구한 논문입니다. 이 논문을 읽게된 계기는 이미지넷과 같이 object…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] EcoTTA: Memory-Efficient Continual Test-time Adaptation via Self-distilled Regularization

오늘 리뷰할 논문은 CVPR 2023년도에 발표된 TTA 분야의 논문입니다.이전 방법론들과 비교했을 때 효율성 측면을 더욱 고려하여 모델 구조를 설계하고, 추가적으로 error accumulation, catastrophic forgetting 문제까지…

Continue Reading
Posted in News Paper X-Review

[Neurips 2020] What Makes for Good Views for Contrastive Learning

1. Introduction 대조 학습(contrastive multiview learning)은 동일한 장면의 두 view을 representation space에서 가깝게 하고, 다른 장면의 두 view을 멀어지게 합니다. 이는 자연스럽고 강력한 아이디어이지만 중요한…

Continue Reading
Posted in Paper X-Review

[ECCV2022]Detecting Twenty-thousand Classes using Image-level Supervision

#676478 이번에 리뷰드릴 논문은 Object Detection 데이터셋의 다양성 한계를 극복하는 방법론을 다루는 논문입니다. Meta AI(이하, 메타)와 텍사스 대학에서 발표된 연구이며 ECCV 2022에 등재되었습니다. 그럼 리뷰를…

Continue Reading
Posted in Conference X-Review

[NerulPS 2022] Flamingo: a Visual Language Model for Few-Shot Learning

당분간 LMM 및 여러 VLM를 리뷰해보려고 하는데요, 이번에 리뷰할 논문은 구글 딥마인드에서 발표한 Visual Language Model(VLM)인 Flamingo 라는 논문입니다. 제목에서와 같이 Few-shot으로도 다양한 task를 수행할…

Continue Reading
Posted in X-Review

[ICASSP 2023]Unifying Speech Enhancement and Separation with Gradient Modulation for End-to-End Noise-Robust Speech Separation

본 논문은 speech enhancemeht와 speech separation task를 e2e 방식으로 수행하며, downstream인 separation에 유효한 정보의 손실을 막기 위해 gradient modulation을 사용하는 방법론에 관한 것으로, speech enhancemet를…

Continue Reading
Posted in Conference News Paper X-Review

[CoRL 2023 oral] VoxPoser: Composable 3D Value Maps for Robotic Manipulation with Language Models

이번 논문은 아주 재밌는 논문 입니다. LLM을 활용해 명시적인 명령어로부터 로봇 조작의 추론 및 명령어 생산하고 VLM(~OVD)을 활용해 로봇을 위한 3차원 공간에 대한 이해를 얻어…

Continue Reading
Posted in Paper X-Review

[ACM MM 2022] Reading and Writing: Discriminative and Generative Modeling for Self-Supervised Text Recognition

안녕하세요, 마흔 번째 X-Review입니다. 이번 논문은 2022년도 ACM MM에 게재된 Reading and Writing: Discriminative and Generative Modeling for Self-Supervised Text Recognition입니다. 바로 시작하도록 하겠습니다. 😵…

Continue Reading
Posted in Conference X-Review

[CVPR 2024]Open-vocabulary object 6D pose estimation

제가 이번에 리뷰할 6D Pose Estimation 논문도 보다 범용적으로 물체의 자세 정보를 추정하기 위한 연구로, 텍스트 프롬프트가 주어졌을 때 이에 대응되는 관심 객체의 자세정보를 추정하는…

Continue Reading