[카테고리:] X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in Paper X-Review

[ECCV 2018] A Joint Sequence Fusion Model for Video Question Answering and Retrieval

우선, 요즘 MSR-VTT 데이터셋을 이용하는 원복 실험을 하는 중인데, text-clip retrieval 의 경우 해당 논문에서 사용한 방법으로 evaluate 를 하길래 읽게 되었습니다. (이 내용이 핵심은…

Continue Reading
Posted in X-Review

[CVPR 2019] Less Is More: Learning Highlight Detection From Video Duration

이번에 가져온 논문은 비디오 요약과는 살짝 방향성이 다른, “비디오 하이라이트”입니다. Facebook에서 수행한 연구인데요… 그래서 그런지 인스타그램 비디오를 마음껏 수집해서 사용하네요. 부럽게… 아무튼 비디오 요약과 다를게…

Continue Reading
Posted in Paper X-Review

[NeurIPS2020] Swapping Autoencoder for deep Image Manipulation

이번에 진행할 리뷰는 Image Translation task과 거의 유사한? Image Manipulation 분야의 논문을 가져왔습니다. 저자는 CycleGAN의 저자인 박태성님이 주저자로 작성한 논문입니다. 이분도 그렇고 Adobe Research가 이쪽…

Continue Reading
Posted in Paper X-Review

[ICLR2020]Revisiting Self-Training for Neural Sequence Generation

기존 Self-Training의 경우 classification task에 주로 사용되었으며 비교적 복잡한 sequence generation tasks(예. machine transflation)는 target space의 구성적 특징으로 그 효과가 명확하지 않았다. 본 논문에서는 self-training이…

Continue Reading
Posted in X-Review

[ICLR 2021] Prototypical Contrastive Learning of Unsupervised Representations

Self-supervised learning 에 대한 논문을 다시 가져왔습니다. 저번 튜토리얼 발표에서도 언급하였지만, self-learning은 contrastive learning 기반의 방법론으로 성능이 큰 폭으로 향상되었는데요. 이번에도 Contrastive learning을 사용한 연구에…

Continue Reading
Posted in News X-Review

[2022 IEEE Access]Content-Based Video Retrieval With Prototypes of Deep Features

캡스톤에서 V2V를 하게 되어 Video Retrieval관련 논문을 찾아보게 되었습니다. content-based video retrieval이기는 하지만 contribution을 읽어봤을 때, 영상적인 측면에서 기여가 있다고 판단하여 읽게 되었습니다. Abstract 해당…

Continue Reading
Posted in Paper X-Review

[ICCV 2019] HowTo100M: Learning a Text-Video Embedding by Watching Hundred Million Narrated Video Clips

Text-Video 데이터셋으로 많이 쓰이는 HowTo100M 에 대한 리뷰입니다. 본 논문의 주요 컨트리뷰션은 아래의 세 가지 입니다. 기존 데이터셋들보다 Large-scale 인, Text-Video 데이터셋 HowTo100M 제안 HowTo100M을…

Continue Reading
Posted in X-Review

[ECCV 2018] Video Summarization Using Fully Convolutional Sequence Networks

오늘은 video summarization 논문입니다. 비디오 요약에서 공개된 코드들이 많이 없어서, 뭘 바탕으로 실험을 해볼까 고르고 고르다가… 이 논문은 누군가가 구현해둔 코드도 있고, 마침 이전에 읽었던…

Continue Reading
Posted in Paper X-Review

[CVPR 2021] Spatiotemporal Contrastive Video Representation Learning

이번에 리뷰할 논문은 self-supervised video representation을 다룬 “Spatiotemporal Contrastive Video Representation Learning” 이라는 논문입니다. 해당 논문에서는 CVRL이라는 video representation learning을 위한 데이터 augmentation 기법을 통해…

Continue Reading
Posted in Paper X-Review

[NAACL 2018] BERT : Pre-training of Deep Bidirectional Transformers for Language Understanding

Before Review 이번 리뷰는 자연어처리 논문을 읽게 되었습니다. BERT라고 해서 아마 한번쯤을 들어보셨을 법한 논문을 읽게 되었는데요, 이번 캡스톤 주제중 하나인 Text-to Video 논문을 읽을라고…

Continue Reading