[NeurIPS2020] Swapping Autoencoder for deep Image Manipulation
이번에 진행할 리뷰는 Image Translation task과 거의 유사한? Image Manipulation 분야의 논문을 가져왔습니다. 저자는 CycleGAN의 저자인 박태성님이 주저자로 작성한 논문입니다. 이분도 그렇고 Adobe Research가 이쪽…
[ICLR2020]Revisiting Self-Training for Neural Sequence Generation
기존 Self-Training의 경우 classification task에 주로 사용되었으며 비교적 복잡한 sequence generation tasks(예. machine transflation)는 target space의 구성적 특징으로 그 효과가 명확하지 않았다. 본 논문에서는 self-training이…
[ICLR 2021] Prototypical Contrastive Learning of Unsupervised Representations
Self-supervised learning 에 대한 논문을 다시 가져왔습니다. 저번 튜토리얼 발표에서도 언급하였지만, self-learning은 contrastive learning 기반의 방법론으로 성능이 큰 폭으로 향상되었는데요. 이번에도 Contrastive learning을 사용한 연구에…
[2022 IEEE Access]Content-Based Video Retrieval With Prototypes of Deep Features
캡스톤에서 V2V를 하게 되어 Video Retrieval관련 논문을 찾아보게 되었습니다. content-based video retrieval이기는 하지만 contribution을 읽어봤을 때, 영상적인 측면에서 기여가 있다고 판단하여 읽게 되었습니다. Abstract 해당…
[ICCV 2019] HowTo100M: Learning a Text-Video Embedding by Watching Hundred Million Narrated Video Clips
Text-Video 데이터셋으로 많이 쓰이는 HowTo100M 에 대한 리뷰입니다. 본 논문의 주요 컨트리뷰션은 아래의 세 가지 입니다. 기존 데이터셋들보다 Large-scale 인, Text-Video 데이터셋 HowTo100M 제안 HowTo100M을…
[ECCV 2018] Video Summarization Using Fully Convolutional Sequence Networks
오늘은 video summarization 논문입니다. 비디오 요약에서 공개된 코드들이 많이 없어서, 뭘 바탕으로 실험을 해볼까 고르고 고르다가… 이 논문은 누군가가 구현해둔 코드도 있고, 마침 이전에 읽었던…
[CVPR 2021] Spatiotemporal Contrastive Video Representation Learning
이번에 리뷰할 논문은 self-supervised video representation을 다룬 “Spatiotemporal Contrastive Video Representation Learning” 이라는 논문입니다. 해당 논문에서는 CVRL이라는 video representation learning을 위한 데이터 augmentation 기법을 통해…
[NAACL 2018] BERT : Pre-training of Deep Bidirectional Transformers for Language Understanding
Before Review 이번 리뷰는 자연어처리 논문을 읽게 되었습니다. BERT라고 해서 아마 한번쯤을 들어보셨을 법한 논문을 읽게 되었는데요, 이번 캡스톤 주제중 하나인 Text-to Video 논문을 읽을라고…
[PMLR 2021] Learning Transferable Visual Models From Natural Language Supervision
image가 주어졌을 때, 그에 대한 text 를 prdict 하는 것을 목적으로 pretrained 된 모델, CLIP에 대한 리뷰입니다. 우선 CLIP은 Contrastive Language-Image Pretraining 의 약자인데요. 이…
[arXiv 2021] QAHOI: Query-Based Anchors for Human-Object Interaction Detection
Action Recognition을 위해, person과 object 간의 interaction과 관련된 논문을 찾아보던 중, Human-Object Interaction (HOI)라는 분야를 알게되어 관련 논문을 리뷰하고자합니다. Action Recognition 분야에서는 현재 scene bias한…
안녕하세요 우진님 리뷰 감사합니다. 먼가 간단한 질문이 있는데 2DGS가 3차원 공간상의 단일 평면으로 어떤 시점에서 보더라도 항상 동일한 평면이 되는건…