[arXiv 2024] GenFlow: Generalizable Recurrent Flow for 6D Pose Refinement of Novel Objects
안녕하세요, 이번에는 무려 네이버 랩스에서 제안한 unseen object pose estimation의 과정 중 refiner를 다룬 논문을 읽어보았습니다. 생소한 내용도 많아서 읽는 데 상당히 오래 걸렸네요.. BOP…
[CVPR 2023] Learning to Generate Language-supervised and Open-vocabulary Scene Graph using Pre-trained Visual-Semantic Space
Before Review 안녕하세요 이번 리뷰도 Scene Graph Generation과 관련된 리뷰를 작성하였습니다. 이번 논문 같은 경우는 Weakly Supervised Learning + Open Vocabulary Learning 상황에서 Scene Graph…
[ICCV2023] Vision Transformer Adapters for Generalizable Multitask Learning
이번에 소개드릴 논문은 ICCV2023에 게재된 논문으로 Adapter를 활용하여 Multitask learning을 수행하는 논문입니다. 본 논문이 요즘 핫한 키워드인 adapter부터해서 zero-shot task transfer, domain generalization 등등 온갖…
[Interspeech 2023] Episodic Memory For Domain-Adaptable, Robust Speech Emotion Recognition
Introduction Speech emotion recognition이란 음성 신호로부터 대상의 감정을 인식하는 task입니다. 인간의 의사 소통에서 감정은 행동이나 욕구에 반영되는 중요한 정보로 작용하기 때문에 human-computer interaction에서 Speech Emotion…
[CVPR 2021] Instance Localization for Self-supervised Detection Pretraining
안녕하세요, 허재연입니다. 중간고사를 마무리하고 오랜만에 논문을 읽어보았는데, 논문 읽기를 쉰 지 얼마나 되었다고 눈에 잘 안 들어오네요. 기말고사 기간이 다가오기 전에 이번 학기 목표를 달성하기…
[CVPR 2021] Multiple Instance Active Learning for Object Detection
지난번 리뷰에서 Active Learning + Object Detection 에 대해 알아보겠다고 했는데요, 이번에는 두번째 시간입니다. 지난 리뷰는 Object Detection에 Active Learning 을 적용한 것 자체에 큰…
[CVPR 2024] What, How, and When Should Object Detectors Update in Continually Changing Test Domains?
안녕하세요.오늘 리뷰할 논문은 Object Detection 분야에서의 TTA 논문입니다. 최근 몇달동안의 제안서 작업에서, 관련 분야를 서베이하다가 발견한 논문입니다.서울대 곽노준 교수님 연구실에서 작성된 논문이며, arXiv 인 줄…
[ECCV 2018] Deep Clustering for Unsupervised Learning of Visual Features
안녕하세요. 이번 리뷰는 owod가 아닌 unsupervised clustering과 관련된 예전 논문을 리뷰합니다. 해당 논문은 unsupervised clustering을 deep learning으로 푼 초기 논문인데, 해당 방식 (unsupervised clustering)을 아이디어로…
[IET 2023] Multilevel receptive field expansion network for small object detection
안녕하세요, 서른두 번째 X-Review입니다. 이번 논문은 2023년도 IET에 올라온 Multilevel receptive field expansion network for small object detection입니다. 바로 시작하도록 하겠습니다. ? 1. Introduction 딥러닝…
[ACL 2023] MultiEMO: An Attention-Based Correlation-Aware Multimodal Fusion Framework for Emotion Recognition in Conversations
안녕하세요. 이번에는 Emotion Recognition 논문이 아닌 ERC 논문을 들고 와봤습니다! 새롭게 나오는 감정인식 논문들이 대부분 ERC 관련 논문이기도 하고 여기는 어떻게 감정 인식을 수행하고 있나…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…