[카테고리:] X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in X-Review

[arXiv 2023] Multimodal Chain-of-Thought Reasoning in Language Models

안녕하세요. 이번에는 Multimodal reasoning이라는 분야의 논문을 한번 가져와밨는데요. CMU의 multimodal lab의 교수님이 강의하시는 multimodal 강의가 있는데 거기에 multimodal reasoning 분야 논문 중 이 논문을 가장…

Continue Reading
Posted in X-Review

[ICLR 2020] Training Binary Neural Networks with Real-to-Binary Convolutions

이번에 리뷰한 논문은 quantization 분야의 논문입니다. 그 중에서도 binary neural network 논문을 가져왔는데요, 모델의 가중치가 0혹은 1로 표현된 binary 모델을 학습하여 full precision의 모델과 비슷한…

Continue Reading
Posted in News X-Review

[CVPRw 2022]Category-Agnostic 6D Pose Estimation with Conditional Neural Processes

제가 이번에 리뷰할 논문은, cross-category level 6D Pose Estimation이라는 새로운 방식의 6D Pose Estimation 방식입니다. 기존에 리뷰했던 논문들은 객체 별로 3D 모델이 필요한 instance-level의 방식과…

Continue Reading
Posted in Conference X-Review

[CVPR 2022 (oral)] CamLiFlow: Bidirectional Camera-LiDAR Fusion for Joint Optical Flow and Scene Flow Estimation

이번 리뷰 논문은 3D optical flow ~ scene flow에 관한 논문이며, 포인트 클라우드와 영상 정보를 어떻게 하면 잘 융합하여 사용할지에 대해서 다룬 방법론에 해당합니다. 2021…

Continue Reading
Posted in Paper X-Review

[arXiv 2022] Unsupervised Prompt Learning for Vision-Language Models

안녕하세요, 이번 주차 X-Review는 22년도 arXiv에 올라온 <Unsupervised Prompt Learning for Vision-Language Models>라는 논문입니다. 해당 논문은 Image Classification 문제를 다루며, 다른 dataset으로의 transfer 시 CLIP의…

Continue Reading
Posted in X-Review

딥러닝 기초

안녕하세요. 제가 처음으로 쓰는 X-Review의 주제는 딥러닝의 기초입니다. 기초 교육을 받으며 공부한 내용을 정리하여 작성하겠습니다. 신경망이란 인간은 뉴런이라고 하는 인간의 뇌세포로 복잡하게 연결된 네트워크를 형성하고,…

Continue Reading
Posted in Conference X-Review

[ECCV2022] RADepth: Resolution Adaptive Self-Supervised Monocular Depth Estimation

제가 이번에 리뷰할 논문은 RADepth라는 ECCV22년도에 게재된 논문입니다. Self-supervised Monocular Depth Estimation task를 다루고 있으며 보다 구체적으로는 다양한 resolution의 영상이 입력으로 들어온다고 하더라도 일관성 있는…

Continue Reading
Posted in Paper X-Review

[Neurocomputing 2022] CLIP4Clip: An Empirical Study of CLIP for End to End Video Clip Retrieval

이런 분들께 이 논문을 추천드립니다. CLIP을 비디오에 적용하는 방식에 흥미가 있으신 분 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive learning에 대한 이해 (CLIP…

Continue Reading
Posted in X-Review

딥러닝 기초 정리

안녕하세요. 저는 첫 X-Review로 딥러닝의 기초에 대해서 정리한 내용을 쓰기로 했습니다. 딥러닝 기초에 모든 내용을 정리한게 아니라 제가 모르고 있거나 더 알고 싶은 내용 위주로…

Continue Reading
Posted in X-Review

[INTERSPEECH 2023] MMER: Multimodal Multi-task Learning for Speech Emotion Recognition

이번에 리뷰할 논문은 Interspeech 2023에 발표된 MMER이라는 논문입니다. 해당 논문은 음성 감정 인식을 수행하기 위해 text데이터를 추가적으로 활용하는 멀티모달 감정인식 논문으로 multi-task learning을 사용하여 IEMOCAP…

Continue Reading