[AAAI 2020] Background Suppression Network for Weakly-Supervised Temporal Action Localization
안녕하세요. 백지오입니다. 여덟 번째 X-REVIEW는 Temporal Action Localization (TAL) task에 약지도학습을 적용한 방법인 Background Suppression Network, BaS-NET 리뷰입니다. 본격적인 리뷰에 앞서, Temporal Action Localization task에…
[CVPR2015]Deep Neural Networks are Easily Fooled: High Confidence Predictions for Unrecognizable Images
서론 해당 논문이 발표된 2015년도에도 DNN을 통한 이미지 인식, 특히 분류(classification)는 많은 데이터셋에서 인간 수준 혹은 그 이상의 성능을 달성했다고 평가됩니다. 그러나 인간과 컴퓨터간의 차이는…
[ECCV 2022] Masked Discrimination for Self-Supervised Learning on Point Clouds
masked autoencoding은 language와 image domain에서 self-supervised learning에 큰 성공을 거두었다. 하지만 masking방식 기반의 pretraining은 3d point cloud를 이해하는데 있어서 이점을 아직 보여주지 못했다. 이에 대해…
[ICASSP 2022] AudioCLIP : Extending CLIP To Image, Text And Audio
23.07.19 : train 파트 내용 추가 안녕하세요. 제가 이전에 CLIP 논문을 리뷰하면서 text, visual modality을 audio, text, visual modality로 확장할 수는 없을까 생각한 적이 있는데요….
[CVPR 2020] ImVoteNet: Boosting 3D Object Detection in Point Clouds with Image Votes
안녕하세요 ! 여섯번째 X-review로 VoteNet에 이어 ImVoteNet을 읽어보았습니다. VoteNet의 구조를 기반으로 하는 논문이라 관련 내용은 지난주에 제가 작성한 리뷰를 참고해주시면 감사하겠습니다. 그럼 리뷰 시작하겠습니다. 1….
[ICCV 2019]Pix2Pose: Pixel-Wise Coordinate Regression of Objects for 6D Pose Estimation
제가 이번에 리뷰할 논문은 6D Pose Estimation 논문 중, Texture-less의 CAD 모델을 이용하는 논문입니다. 열화상 영상으로까지 6D Pose Estimation을 확장하려면, 열화상 영상에 대한 texture 정보를…
[CVPR-2018] FOTS : Fast Oriented Text Spotting with a Unified Network
안녕하세요. 여섯번째 X-Review입니다. 이번 리뷰는 2018년도 CVPR에 게재된 <FOTS : Fast Oriented Text Spotting with a Unified Network> 논문입니다. 바로 시작할게요 ! ? Introduction OCR은…
[ICCV 2021]SO-Pose: Exploiting Self-Occlusion for Direct 6D Pose Estimation
안녕하세요, 양희진입니다. 이번에도 6D Pose estimation 관련 논문입니다. 예전에 꽤 최근에 이 논문을 찾게 되었고, 수식적인 부분은 꽤 어려웠으나 괜찮은 접근법인 것 같아 한 번…
[ECCV2020](Best Paper) RAFT: Recurrent All-Pairs Field Transforms for Optical Flow
이번에 가져온 논문도 지난번과 동일하게 Optical Flow 관련 논문입니다. 제가 최근에 optical flow 관련해서 적용해보면 좋을 것 같은 아이디어가 하나 떠올라서 이를 적용하기 전에 관련…
[ICML 2021] EfficientNetV2: Smaller Models and Faster Training
Introduction 딥러닝 모델과 사용되는 데이터의 크기가 커짐에 따라 딥러닝의 training efficiency의 중요성 또한 증가하였으며, 관련 연구 또한 활발히 진행되었습니다. 대표적으로 CNN기반 모델에는 불필요한 batch norm을…
안녕하세요 지연님 좋은 리뷰 감사합니다. SGM 설명해주시는 부분에서 저는 문맥상 SGM이 학습시에만 사용되서 visual feature가 context정보를 학습하도록 돕는다고 이해했는데 "SGM은…