Author: 김 주연

Posted in X-Review

[CVPR 2024] Multimodal Representation Learning by Alternating Unimodal Adaptation

안녕하세요! 이번에도 멀티모달 분야의 논문을 가져와봤습니다. 이번에는 따끈따근한 CVPR 2024 논문을 가져와봤는데요. 논문이 참신하면서도 높은 성능을 달성하여서 꼼꼼히 보고자 리뷰로 작성하게 되었습니다. 그럼 리뷰 시작합니다!…

Continue Reading
Posted in X-Review

[WACV 2021] Multi-Loss Weighting with Coefficient of Variations

안녕하세요. 이번에는 loss와 관련한 논문을 들고와봤습니다. 제가 이번에 진행하는 실험에서 계속 loss가 불안정하다는 것을 발견하고 굉장히 나이브하게 weight를 주는 실험을 진행해봤는데요. 정말 꿈쩍도 안하는 성능이…

Continue Reading
Posted in X-Review

[CVPR 2020] What Makes Training Multi-modal Classification Networks Hard?

안녕하세요! 이번에도 multimodal 관련 논문을 들고 왔는데요. 제목이 굉장히 흥미가 돋지 않습니까? 그래서 리뷰하고자 하였습니다. 그럼 리뷰 시작합니다! <Abstract> 본 논문에서는 multimodal 성능이 un-modal 성능에…

Continue Reading
Posted in X-Review

[TPAMI 2023] General Greedy De-Bias Learning

안녕하세요! 이번에는 저번에 리뷰했던 GGE의 후속 논문인 GGD를 가져와봤습니다! 지난번과 마찬가지로 de-bias에 초점을 맞춘 논문이고요. 차이점이 있다면 GGE의 경우 VQA task에서의 de-bias를 초점을 맞췄다면 이번…

Continue Reading
Posted in X-Review

[ICCV 2021] Greedy Gradient Ensemble for Robust Visual Question Answering

안녕하세요. 이번에도 VQA 논문을 가져오게 되었습니다. 요즘 VQA 방법론에 대해서 흥미로운 부분이 많다고 느꼈는데, 이번에 초청 세미나 때 조재원 교수님께서 추천한 논문이 있는데 그 논문의…

Continue Reading
Posted in X-Review

[TASLP 2024] CausalABSC: Causal Inference for Aspect Debiasing in Aspect-Based Sentiment Classification

안녕하세요. 이번에는 이전에 리뷰하였던 CF-VQA의 최신 후속 논문을 가져와봤습니다. CF-VQA에 대한 이해도가 있으면 이 논문 또한 이해하기 훨씬 쉬우니 제 이전 리뷰를 읽고 오시는 것도…

Continue Reading
Posted in X-Review

[CVPR 2021] Counterfactual VQA: A Cause-Effect Look at Language Bias

안녕하세요. 이번에는 제가 준비하고 있는 논문의 시초라고 생각되는 논문을 가져와봤습니다. 저는 요즘 language bias에 굉장히 관심이 많아서요. 이 논문이 어떻게 RUBi를 확장했고 그래서 얼마나 bias를…

Continue Reading
Posted in X-Review

[CVPR 2023] PMR: Prototypical Modal Rebalance for Multimodal Learning

오늘도 멀티모달 논문입니다! 제가 이제까지 VQA 논문을 읽은 이유는 Multimodal bias에 관심이 많아서 인데요. 두개의 모달리티를 모두 사용하지만 하나의 모달리티만 학습되는 상황에 어떻게 대처를 하는가에…

Continue Reading
Posted in X-Review

[arXiv 2023] Multimodal Chain-of-Thought Reasoning in Language Models

안녕하세요. 이번에는 Multimodal reasoning이라는 분야의 논문을 한번 가져와밨는데요. CMU의 multimodal lab의 교수님이 강의하시는 multimodal 강의가 있는데 거기에 multimodal reasoning 분야 논문 중 이 논문을 가장…

Continue Reading
Posted in X-Review

[EMNLP 2022] Beyond Additive Fusion: Learning Non-Additive Multimodal Interactions

안녕하세요. 이번에도 감정인식 논문인데요. 하지만 약간 특이한 논문을 가져와봤습니다. VQA에 biasing과 비슷한 논문이라고 할 수 있는데요. 실제로 rubi(이전에 리뷰한 글 참고)를 reference하기도 한 논문이었습니다. 그러면…

Continue Reading