Author: 임 근택
[ICLR 2022] Uniformer : Unified Transformer For Efficient Spatiotemporal Representation Learning
Before Review 이번에도 BackBone 연구 입니다. 이전에 조원 연구원이 리뷰한 TimeSformer와 비슷하게 비디오 데이터를 Vision Transformer를 바탕으로 이해하는 연구 입니다. 흥미로웠던 것은 3D CNN의 장점과…
[ICML 2021] An Image is Worth 16×16 Words : Transformer for image recognition at scale
Before Review Vision Transformer(ViT) 논문입니다. 요즘 비디오 분야에서도 Transformer 기반의 백본이 활발하게 연구가 되는 추세입니다. 저도 관련해서 계속 follow-up을 하고 있는데 제가 ViT에 대한 detail을…
[NIPS 2022] VideoMAE : Masked Autoencoders are Data-Efficient Learners for Self-Supervised Video Pre-Training
Before Review 사실 제가 지난 리뷰에서 이미지 도메인에서의 MAE를 다뤘는데 그 이유는 바로 VideoMAE를 읽기 위함이었습니다. 그리고 또한 VideoMAE를 읽는 이유는 이번에 비디오 분야에서 개쩌는(?)…
[CVPR 2022] Masked Autoencoders Are Scalable Vision Learners
Before Review 진짜 오랜만에 X-Review 인 것 같습니다. 이번에는 비디오 논문이 아닌 이미지 논문을 읽게 되었습니다. 요즘 Masking Model 들이 많은 연구가 이루어지고 있어서 저도…
<2022년 RCV 연구실 생활을 마무리 하며>
어느덧 22년의 마지막을 바라보고 있습니다. 그리고 저는 이제 RCV에 들어온 지 벌써 2년 정도가 되었네요. 내년부터는 학부 졸업을 하고 대학원 석사 과정으로 RCV에 합류하게 됩니다….
[CVPR 2022] Probabilistic Representations for Video Contrastive Learning (Part.1)
Before Review 정말 오랜만에 논문을 읽는 것 같습니다. 2달만에 리뷰 작성이네요. 원래는 에트리 다음 연도 연구 계획이랑 관련된 논문을 읽으려고 했지만 이번에 준비한 논문 제목도…
CVPR 2023 논문 작성기
이번 X-Review는 CVPR 2023 논문 작성기로 대체하도록 하겠습니다. 논문 작성기 아마 에트리 7월 정례회의에 들고 갔던 Video-level feature 실험을 기점으로 본 논문이 시작되었던 것 같네요….
Optimization Theory (Gradient Descent – Convergence Analysis)
CVPR 논문 작업을 마치고, 주말 사이 다른 논문을 찾아볼 여유가 없어 이전에 제가 지난 학기 공부 했던 최적화 이론을 바탕으로 Geadient Descent 알고리즘에 대해 간단한(?)…
[2022 CVPR] Scene Consistency Representation Learning for Video Scene Segmentation
Before Review 이번 리뷰는 Self-Supervised 기반의 Video Representation Learning 논문을 읽었습니다. Video Scene Segmentation을 위한 논문이지만, 결국 Long-Term 비디오를 이해한다는 관점에서 저의 연구 방향에 도움이…
[2021 NIPS] Relational Self-Attention What’s Missing in Attention for Video Understanding
Before Review 이번 논문은 비디오를 이해하는 데 있어 중요하게 작용하는 요소들을 고려하여 새롭게 제안된 attention 메카니즘을 다룬 논문입니다. Neurips 페이퍼는 Core-ML쪽만 다루는 줄 알았는데 Computer…
최신 댓글