Author: 광진 이

Posted in X-Review

[ACCV 2018 Workshops] Summarizing Videos with Attention

이번 논문도 video summarization입니다. 이 논문은 RNN과 LSTM을 많이 사용하던 video summarization에 long-range dependence를 보존하기 위해 attention mechanism을 처음으로 적용한 논문입니다. 코드도 공개하고 있는데, 간단하긴…

Continue Reading
Posted in X-Diary

URP 조교를 마무리 하며 @이광진

지난 여름에는 멘티였는데, 이번에는 조교로 7기 URP를 보냈습니다. 사실 멘티로 URP 후기 쓰는 것도 많은 고민을 하면서 작성했는데, 이번 것도 쉽지 않네요. 물론 누군가를 가르치는…

Continue Reading
Posted in Paper X-Review

[Pattern Recognition] Learning multiscale hierarchical attention for video summarization

안녕하세요. 지난번에 unsupervised video summarization에 이어서 이번에는 supervised video summarization 논문을 들고왔습니다. Introduction Video summarization에 대한 설명은 지난번 리뷰에 있으니 넘어가고, 이 논문에서 제안하는 “multiscale…

Continue Reading
Posted in Paper X-Review

STRNN: End-to-end deep learning framework for video partial copy detection

최근에는 비디오 정렬과 관련된 논문을 읽었습니다. 비디오 정렬도 논문을 검색해보면 크게 두가지로 나뉘어집니다. 영어로는 똑같은 alignment를 공유해서 사용하고는 있지만, Video Syncronization에 가까운 (비디오 프레임을 조정해서…

Continue Reading
Posted in Paper X-Review

[ICCV-2017] Near-Duplicate Video Retrieval with Deep Metric Learning

이번에는 Video retrieval 논문 읽기에서 골라서 읽은 논문으로 가져왔습니다. (2017) Near-Duplicate Video Retrieval by Aggregating Intermediate CNN Layers (2017) Near-Duplicate Video Retrieval with Deep Metric…

Continue Reading
Posted in Paper X-Review

[CVPR 2019] Video Summarization by Learning from Unpaired Data

오늘은 video summarization에 대한 논문을 가져왔습니다. 긴 비디오를 압축 한다는 말은, 결국 비디오가 담고 있는 주제를 잘 요약한다는 것이고 궁극적으로 비디오 검색에도 활용이 가능하지 않을까…

Continue Reading
Posted in Paper X-Review

Near-Duplicate Video Retrieval by Aggregating Intermediate CNN Layers

지난주 잠시 감정인식으로 들어갔다가 video retrieval 관련 논문 나눠 읽기로 배정된 논문으로 다시 돌아왔습니다. 비디오 검색을 안하는 분들이라도 저희가 ViSiL은 많이 언급해서 아실텐데요. 그 ViSiL을…

Continue Reading
Posted in Paper X-Review

Multimodal End-to-End Sparse Model for Emotion Recognition

안녕하세요. 갑자기 왜 감정인식 논문을 들고 왔는가 하면… 과제때 쓸 베이스라인 논문으로 삼을 것 같아서 이 논문을 읽었습니다. 제가 골라서 읽은 논문은 아니고, 비디오 검색…

Continue Reading
Posted in Paper X-Review

YouTube-8M: A Large-Scale Video Classification Benchmark

이번에는 video classification 관련 데이터셋 논문을 들고왔습니다. 사실 muses라는 데이터셋을 공개한 “Multi-Shot Temporal Event Localization: A Benchmark”을 읽기로 되어있었는데, 이 논문이 성격도 비슷하면서 저에게 필요한…

Continue Reading
Posted in Paper X-Review

VCDB: A Large-Scale Database for Partial Copy Detection in Videos

이번주 리뷰부터는 video retrieval 관련 논문으로 돌아왔습니다. 시작은 간단하게 데이터셋 논문부터 시작합니다. VCDB는 비디오 관련 데이터셋으로 많이 쓰이는 데이터셋입니다. ViSiL도 이 데이터셋으로 학습을 하고 있고….

Continue Reading