[CVPR 2023] VideoMAE V2 Scaling Video Masked Autoencoders with Dual Masking
Before Review 오랜만에 X-Review 입니다. ITRC 작업 때문에 바쁘다는 핑계로 논문 공부를 부족하게 했던 것 같습니다. 오랜만에 논문을 읽으려고 하니 눈에 잘 안들어오고 집중도 잘…
[NeurIPS 2022 Invited Talks] The Forward-Forward Algorithm: Some Preliminary Investigations
안녕하세요. 열 번째 X-Review입니다. 지난 4월 간의 일정을 마친 후 5월에 들어서며 오랜만에 작성하는 X-Review입니다. 다음 주부터 현재 주 관심 분야인 Small-object detection과 관련된 실험을…
[CVPR2021] Rethinking and Improving the Robustness of Image Style Transfer
4월 한달 일정이 너무 바쁘다보니 오랜만에 x리뷰를 작성해보네요. 이번에 가져온 논문은 Style Transfer 관련 논문으로 내용이 상당히 재밌어보여서 가져와보았습니다. Style Transfer에 대한 지식이 없으신 분들은…
[CVPR 2023] TimeBalance: Temporally-Invariant and Temporally-Distinctive Video Representations for Semi-Supervised Action Recognition
Introduction 오늘도 Video representation learning에 관한 논문을 들고왔습니다. 서론은 이제 너무 많이 이야기해서 중복이니까 빼고… 본론으로 바로 넘어가겠습니다. 궁금하신 분들이 있다면 제 이전 리뷰를 참고하시면…
[NeurIPS 2020] Denoising Diffusion Probabilistic Models
이번에 들고온 논문은 GAN을 누르고 생성 모델의 대세로 등극한 Diffusion model의 근본 논문 ‘Denoising Diffusion Probabilistic Models (DDPM)’을 다루고자 합니다. 해당 논문은 요즘 핫한 DALL-E,…
[ICCV 2021]Group-Free 3D Object Detection via Transformers
irregular한 3d point cloud에서 object representation을 추출하기 위해서 기존의 방법론들은 points들을 grouping하여 object로 판단되는 각 point마다 object candidate로 할당하여 object features를 추출하였다. 하지만 hand-crafted 방식으로…
[CVPR 2023]R2Former: Unified Retrieval and Reranking Transformer for Place Recognition
제가 이번에 리뷰할 논문은 Retrieval기반의 위치 인식 논문입니다. 제가 리뷰했던 TransVLAD(논문, 리뷰)를 인용한 논문이라 관심이 생겨 리뷰를 하게 되었습니다. 아직 arxiv에 있지만 찾아보니 CVPR 2023에…
[CVPR 2022] RBGNet: Ray-based Grouping for 3D Object Detection
기존 3d object detection 방법론들에서는 object의 foreground surface geometric 정보를 충분히 사용하지 못했다. 본 논문에서는 voting방식을 기반으로 하는 RBGNet을 제안한다. 이름에서 알 수 있듯이 ray를…
[ICASSP 2022] MEmoBERT: Pre-training Model with Prompt-based Learning for Multimodal Emotion Recognition
안녕하세요. 이번 논문은 멀티모달 감정인식에도 사전학습 모델이 나올 수 있구나를 볼 수 있는 논문이여서 신박하여서 가져와봤는데요. 이름에서 알 수 있듯이 bert 기법이 많이 적용된 논문입니다….
[CVPR 2023] Masked Motion Encoding for Self-Supervised Video Representation Learning
제안서를 쓰고 돌아오니 CVPR 2023 accepted paper 리스트가 공개되었더라고요. 또 시즌이 되었습니다. 재밌는 논문이 뭐가 있을까 찾아보다가 하나 잡아서 들고온 논문인데요. MAE인데 비디오라서 하나 들고와봤습니다….
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…