Category: X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
Multimodal End-to-End Sparse Model for Emotion Recognition
안녕하세요. 갑자기 왜 감정인식 논문을 들고 왔는가 하면… 과제때 쓸 베이스라인 논문으로 삼을 것 같아서 이 논문을 읽었습니다. 제가 골라서 읽은 논문은 아니고, 비디오 검색…
[ECCV2020] Self-Supervised CycleGAN for Object-Preserving Image-to-Image Domain Adaptation
이번에 리뷰할 논문은 Image to Image Translation(I2IT)입니다 근데 이제 Domain Adaptation(DA)를 곁들인. 논문의 제목을 보시면 대충 감이 잡히시지 않을까싶은데 해당 논문에서 하고자 하는 것은 Unpaired…
[CVPR 2017] VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection
이번주 리뷰는 포인트클라우드만을 사용하여 3D Detection을 수행하는 아주 유명한 방법론인 VoxelNet에 대해서 진행하겠습니다. 원래 PV-RCNN++를 다룰까 했지만 아직 Question mark가 해결 안되는 내용이 많아서 일단…
About Grabber(2)
저번 리뷰(About Grabber(1)) 에 이어서 Grabber Manual을 위한 정리를 작성했습니다. 목차 (작성하며 변경예정) 1. Multi-spectral Grabber2. QT3. Ebus SDK4. Code Review 2. QT 3. Ebus…
[CVPR 2021] Removing the Background by Adding the Background: Towards Background Robust Self-supervised Video Representation Learning
Before Review 이번에는 비디오 관련 논문이지만 Video Representation Learning을 다룬 논문을 읽게 됐습니다. 본래는 Weakly Supervised Temporal Action Localization 쪽을 계속 follow up 할 생각이었는…
[CVPR2021] Single Pair Corss-Modality Super Resolution
일전에 리뷰를 진행했던 ‘[CVPR2020] Unsupervised Multi-Modal Image Registration via Geometry Preserving Image-to-Image Translation‘ 논문의 저자와 같은 연구실에서 2021 CVPR에 억셉된 논문입니다. 해당 논문은 일반적으로 RGB…
[ICLR 2020] Deep Batch active Learning by Diverse, Uncertain Gradient Lower Bounds
이번에도 Active Leaning 관련 리뷰입니다. 저는 최근 몇 주동안 Active Learning 논문에 대해 리뷰를 작성하였습니다. Active Learning 이란 Unlabeled Data에서 사람이 반드시 라벨링을 해야하는 데이터를 찾는…
[ECCV 2020] SRFlow: Learning the Super-Resolution Space with Normalizing Flow
이번 논문은 Normalizing-flow를 이용한 Super resolution 방법론 입니다. 제가 요즘 Normalizing-flow(NF)에 많은 관심을 가지고 있다는 것을 연구실 내 몇몇 분들은 알고 있으실 겁니다. 근데 어쩌다가…
Protected: [CVPR2022 PeerReview] Interactive Learning of Intrinsic and Extrinsic Properties for All-day Semantic Segmentation
There is no excerpt because this is a protected post.
YouTube-8M: A Large-Scale Video Classification Benchmark
이번에는 video classification 관련 데이터셋 논문을 들고왔습니다. 사실 muses라는 데이터셋을 공개한 “Multi-Shot Temporal Event Localization: A Benchmark”을 읽기로 되어있었는데, 이 논문이 성격도 비슷하면서 저에게 필요한…
질문 감사합니다. φ_db와 φ_llm을 곱하는 게 아니 더하는 등의 다양한 조합에 대해서는 논문에 따로 언급하고있지 않습니다. (Supplementary Material에도 따로 없네요)…