[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[NeurIPS 2023] Bridging the Domain Gap: Self-Supervised 3D Scene Understanding with Foundation Models
안녕하세요, 서른 다섯번째 x-review 입니다. 이번 논문은 2023년도 NeurIPS에 게재된 Bridging the Domain Gap: Self-Supervised 3D Scene Understanding with Foundation Models 입니다. 그럼 바로 리뷰…
[CVPR 2022] Target-Relevant Knowledge Preservation for Multi-Source Domain Adaptive Object Detection
안녕하세요. 지난 2번의 리뷰 간 MSDA OD, Mulit-Source Domain Adaptation for Object Detection 논문을 리뷰하였습니다. 맨 처음 리뷰한 논문은 DMSN으로 DAOD, Domain Adpataion for Object…
[NeurIPS 2020] Unsupervised Learning of Visual Features by Contrasting Cluster Assignments
안녕하세요. 허재연입니다. 한동안 계속 Self-Supervised Learning쪽 논문을 읽고 있습니다. 이번에 다룰 논문도 image data의 visual feature를 어떻게 unsupervised방법으로 학습할 지를 다룬 visual representation learning 분야…
[arXiv 2024] PS6D: Point Cloud Based Symmetry-Aware 6D Object Pose Estimation in Robot Bin-Picking
안녕하세요, 이번에는 instance-level에 속하는 6D pose estimation 관련 논문을 읽어보았습니다. 기존 리뷰 했던 내용들은 주로 RGB/RGB-D를 사용하는 방법론이었는데, PS6D 같은 경우는 포인트 클라우드만을 입력으로 사용하여…
[AAAI 2024] TR-DETR: Task-Reciprocal Transformer for Joint Moment Retrieval and Highlight Detection
안녕하세요. 오늘의 X-Review는 24년도 AAAI에 게재된 <TR-DETR: Task-Reciprocal Transformer for Joint Moment Retrieval and Highlight Detection> 논문입니다. 비디오 도메인에서 Moment Retrieval과 Highlight Detection task를 동시에…
[CVPR 2022] Active Learning by Feature Mixing
황유진 연구원과 제출한 논문에서 받은 리뷰 중, 해당 논문에 대해서도 성능 비교 실험에 추가해달라는 코멘트가 있었습니다. 이에 제가 작성한 리뷰를 살펴보니, 해당 논문을 자세하게 리뷰한…
[CVPR 2024] OneLLM: One Framework to Align All Modalities with Language
안녕하세요. 최근에 계속해서 LLM 관련으로 논문을 읽게 되는 것 같습니다. LLM 논문을 볼 때마다 아쉬웠던 점이, 멀티모달 LLM 관련하여 vision-text 분야 LLM은 굉장히 논문이 많이…
[ICASSP 2022] Improving Noise Robustness of Contrastive Speech Representation Learning with Speech Reconstruction
Introduction Automatic Speech Recognition이란 speech에서 text를 인식하는 것을 의미하며, 최근에는 딥러닝 기술을 적용한 ASR이 널리 활용되고 있습니다. 그러나 ASR 모델을 real-world에서 사용하고자 하는 경우, 입력…
[ICML 2022] Efficient Test-Time Model Adaptation without Forgetting
안녕하세요.오늘 작성할 리뷰는 EATA 라고 불리는 TTA 분야의 논문입니다. 기존 TENT 방법론 대비 조금 더 효율성을 증대한, efficient 한 TTA 방법론입니다.바로 리뷰 시작하겠습니다. 1. Introduction…
[ICASSP 2024] Customising General Large Language Models for Specialised Emotion Recognition Tasks
안녕하세요. 최근에 세미나에서 발표한 NAACL 2024 논문의 경우도 Prompt를 활영하여 인코딩 하는 식으로 LLM을 사용하는 모습을 볼 수 있었는데 여기를 더 팔로업 해보고자 LLM을 감정…
최신 댓글