[카테고리:] X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in Paper X-Review

[ICLR2020]Revisiting Self-Training for Neural Sequence Generation

기존 Self-Training의 경우 classification task에 주로 사용되었으며 비교적 복잡한 sequence generation tasks(예. machine transflation)는 target space의 구성적 특징으로 그 효과가 명확하지 않았다. 본 논문에서는 self-training이…

Continue Reading
Posted in X-Review

[ICLR 2021] Prototypical Contrastive Learning of Unsupervised Representations

Self-supervised learning 에 대한 논문을 다시 가져왔습니다. 저번 튜토리얼 발표에서도 언급하였지만, self-learning은 contrastive learning 기반의 방법론으로 성능이 큰 폭으로 향상되었는데요. 이번에도 Contrastive learning을 사용한 연구에…

Continue Reading
Posted in News X-Review

[2022 IEEE Access]Content-Based Video Retrieval With Prototypes of Deep Features

캡스톤에서 V2V를 하게 되어 Video Retrieval관련 논문을 찾아보게 되었습니다. content-based video retrieval이기는 하지만 contribution을 읽어봤을 때, 영상적인 측면에서 기여가 있다고 판단하여 읽게 되었습니다. Abstract 해당…

Continue Reading
Posted in Paper X-Review

[ICCV 2019] HowTo100M: Learning a Text-Video Embedding by Watching Hundred Million Narrated Video Clips

Text-Video 데이터셋으로 많이 쓰이는 HowTo100M 에 대한 리뷰입니다. 본 논문의 주요 컨트리뷰션은 아래의 세 가지 입니다. 기존 데이터셋들보다 Large-scale 인, Text-Video 데이터셋 HowTo100M 제안 HowTo100M을…

Continue Reading
Posted in X-Review

[ECCV 2018] Video Summarization Using Fully Convolutional Sequence Networks

오늘은 video summarization 논문입니다. 비디오 요약에서 공개된 코드들이 많이 없어서, 뭘 바탕으로 실험을 해볼까 고르고 고르다가… 이 논문은 누군가가 구현해둔 코드도 있고, 마침 이전에 읽었던…

Continue Reading
Posted in Paper X-Review

[CVPR 2021] Spatiotemporal Contrastive Video Representation Learning

이번에 리뷰할 논문은 self-supervised video representation을 다룬 “Spatiotemporal Contrastive Video Representation Learning” 이라는 논문입니다. 해당 논문에서는 CVRL이라는 video representation learning을 위한 데이터 augmentation 기법을 통해…

Continue Reading
Posted in Paper X-Review

[NAACL 2018] BERT : Pre-training of Deep Bidirectional Transformers for Language Understanding

Before Review 이번 리뷰는 자연어처리 논문을 읽게 되었습니다. BERT라고 해서 아마 한번쯤을 들어보셨을 법한 논문을 읽게 되었는데요, 이번 캡스톤 주제중 하나인 Text-to Video 논문을 읽을라고…

Continue Reading
Posted in Paper X-Review

[PMLR 2021] Learning Transferable Visual Models From Natural Language Supervision

image가 주어졌을 때, 그에 대한 text 를 prdict 하는 것을 목적으로 pretrained 된 모델, CLIP에 대한 리뷰입니다. 우선 CLIP은 Contrastive Language-Image Pretraining 의 약자인데요. 이…

Continue Reading
Posted in Paper X-Review

[arXiv 2021] QAHOI: Query-Based Anchors for Human-Object Interaction Detection

Action Recognition을 위해, person과 object 간의 interaction과 관련된 논문을 찾아보던 중, Human-Object Interaction (HOI)라는 분야를 알게되어 관련 논문을 리뷰하고자합니다. Action Recognition 분야에서는 현재 scene bias한…

Continue Reading
Posted in Conference Paper X-Review

[ICRA 2019] Build your own hybrid thermal/EO camera for autonomous vehicle

이번 논문은 제 연구 계획에서 핵심인 센서 팩 계획에 영감을 준 논문 중 하나입니다. 해당 논문은 빔스플리트를 이용한 광학 정합을 이용한 RGB-Thermal 센서 팩을 구조를…

Continue Reading