[ICCV2023] Self-Supervised Monocular Depth Estimation by Direction-aware Cumulative Convolution Network
이번에 소개드릴 논문은 ICCV2023에 게재된 Self-supervised monocular depth estimation 관련 논문으로, monocular depth estimation이라는 task에 초점을 맞춘 모듈을 새롭게 제안함으로써 성능을 향상시키고자 한 논문입니다. Intro…
[ECCV 2020] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
안녕하세요, 이번에는 김태주 연구원님께서 6D Pose estimation task와 한 번 접목시켜보도록 공부해보라고 하셨던 조언을 듣고, 다들 알고 계실 것 같은 NeRF를 리뷰해봤습니다. 카메라 기반의 방법론이다보니…
What should we consider to write a clean and efficient code as a researcher?
안녕하세요. 백지오입니다. 열 여덟 번째 X-REVIEW는 논문 리뷰가 아닌 코드에 관련된 내용을 준비했습니다. 연구실에서 공부와 여러 task를 진행하며, 자연스럽게 논문과 관련된 코드를 많이 읽고, 실행해볼…
[NeurIPS 2021] Does Knowledge Distillation Really Work?
이번에 리뷰할 논문은 지난 리뷰와 마찬가지로 knowledge distillation에 관한 분석 논문입니다. Knowledge distillation이란 teacher의 예측값을 student의 정답 값으로 사용하여 크기가 작은 모델인 student의 capacity를 증진시키는…
[CVPR 2023]Object Pose Estimation with Statistical Guarantees: Conformal Keypoint Detection and Geometric Uncertainty Propagation
제가 이번에 리뷰할 논문은, 6D Pose Estimation의 예측값의 신뢰도를 고려하기 위해 uncertainty 개념을 도입한 방법론입니다. Abstract 2-stage 방식의 object estimation은 semantic keypiont를 예측한 뒤, reprojection…
[CVPR 2021] Prototypical Pseudo Label Denoising and Target Structure Learning for Domain Adaptive Semantic Segmentation
안녕하세요, 오늘 리뷰할 논문도 마찬가지로 UDA (Unsupervised Domain Adaptation) 을 수행하는 논문입니다.Prototype의 개념을 활용하였고, noise가 포함되어 있는 pseudo label 을 denoising하는 기법도 소개하고 있습니다. 논문을…
[COLINGw 2022] Shapes of Emotions: Multimodal Emotion Recognition in Conversations via Emotion Shifts
안녕하세요. 오랜만에 ERC(Emotion Recognition in Conversation) 논문을 들고와봤습니다. COLING은 익숙하지 않은 학회일텐데 NLP 학회 중 하나입니다. 이번 논문은 제목이 재미있어 가져와봤는데요. emotion의 shape이라니,, 뭔가 구미가…
[ICLR 2018] Active Learning For Convolutional Neural Networks: A Core-Set Approach
안녕하세요, 허재연입니다. 이제 슬슬 논문 읽는 분야를 Representation Learning에서 Active Learning(AL)으로 옮기려 하고 있습니다. 앞으로 한동안은 AL, MAE 관련 리뷰를 작성하지 않을까 싶습니다. 제가 AL의…
[ICCV 2019] Few-shot Object Detection via Feature Reweighting
안녕하세요. 스물한 번째 리뷰입니다. 지난 두 번의 리뷰에 이어 Few-shot object detection 논문을 리뷰합니다. 해당 논문은 엄밀히는 처음 리뷰한 LSTD 이후의 논문이지만, 지난 주에는 이번…
[ICLR 2023] CLIP-VIP: Adapting Pre-Trained Image-Text Model to Video-Language Alignment
이런 분들께 이 논문을 추천드립니다. CLIP과 같은 이미지 사전학습 모델을 대규모 비디오 데이터셋에서 추가 사전학습 시키는 방법이 궁굼하신 분 Subtitle과 Caption으로 다른 성질의 text 데이터…
안녕하세요 우현님 리뷰 재밌게 읽었습니다. 뭔가 classification용 데이터셋에서 수도라벨을 만들때, MM-GDINO를 통해 만든 박스 시각화 이미지를 하나쯤 첨부했으면? 그 모델의…