[AAAI 2022] Behind the Curtain: Learning Occluded Shapes for 3D Object Detection
이번 주 x-review는 3D detection중에서 나온지 얼마 안되었고 일부 데이터셋에서 SOTA를 달성한 논문에 대해서 리뷰하겠습니다. 음… 공개된지 2주정도 된거 같고 상당히 좋은 학회인 AAAI 2022에…
[ICCV 2021] Boundary-sensitive Pre-training for Temporal Localization in Videos
Before Review 이번 리뷰는 Temporal Localization 논문으로 준비했습니다. 이전에 리뷰했던 TSP : Temporally-Sensitive Pretraining of Video Encoders for Localization Tasks 논문과 컨셉은 비슷하지만 접근 방식이…
[WACV2022] Low-cost Multispectral Scene Analysis with Modality Distillation
해당 논문은 ‘Heng ZHANG‘이라고 Multispectral Pedestrian Detection을 열심히 수행하는 한 연구자가 작성한 논문입니다. 해당 저자는 Multispectral Pedestrian 연구를 활발히 진행중인 연구자 중 한명입니다. 해당 연구는…
BSN : Boundary Sensitive Network for Temporal Action Proposal Generation
Temporal action proposal 생성을 하기 위해 제안된 방법인 BSN (Boundary-Sensitive Network)에 대해 소개하는 논문입니다. 간단히 말하면 액션의 경계에 좀 더 민감하게 반응하는 네트워크예요. 우선 Temporal…
[CVPR2020]State-Relabeling Adversarial Active Learning (SRAAL)
1. 요약해당 논문은 데이터의 레이블이 없는 Unlabeled 데이터의 가치를 효과적으로 판단하는 모델을 학습하기 위해 Labeled data의 Annotation 정보와 Labeled data+Unlabeled data의 State 정보(=Labeled/Unlabeled)를 모두 사용하는…
[NIPS 2017]Attention is All You Need (Part.2)
Before Review 정말 오랜만에 X-Review 인 것 같습니다. 바쁘다는 핑계로 X-Review 작성에 소흘했던 것 같습니다. 얼추 학기가 마무리되고 다른 일들도 마무리가 되어가니 다시 X-Review를 성실히…
[ICCV2021] Self-supervised Product Quantization for Deep Unsupervised Image Retrieval
이번에 리뷰할 논문은 기존과는 매우 다른 테스크에서 가져왔습니다. 이 논문은 영상 검색을 위해서 영상을 vector로 만드는 테스크입니다. 본 논문을 고른 이유는 현재 제가 하려고 하는…
Web-Scale Responsive Visual Search at Bing
최근에 visual search와 관련된 논문들을 읽고 있습니다. 대부분의 논문에서 visual search를 Content-based Image Retrieval과 동일한 용어로 정의합니다. 이 task는 이미지가 주어 졌을 때, 해당 이미지와…
[CVPR 2020] A U-Net Based Discriminator for Generative Adversarial Networks
이번에 읽은 논문은 Thermal to RGB translation (image-to-image translation, I2IT) 을 하기 위해 여러 논문들을 찾아보면서 알게된 논문입니다. 이 논문은 I2IT 를 직접적으로 다루지는 않았지만…
[CVPR2021]Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation
이번 논문은 Image Generation, Image to Image Translation 쪽 분야 논문입니다. Image Generation 분야에서 매우 유명한 StyleGAN을 기반으로 자신들이 제안하는 새로운 Encoder를 통해 Image Translation까지…
안녕하세요 성민님 좋은 질문 갑사합니다! 순서대로 답변 드리겠습니다! Q1. MLLM이 주어진 vision정보와 text정보를 이해하고 annotation된 library에서 retrieval 하는 방식인데, prompt를…