Author: 박 성준
[AAAI2019]Multilevel Language and Vision Integration for Text-to-Clip Retrieval
안녕하세요. 오늘은 moment retrieval (video temporal grounding) task를 다룬 논문입니다. 바로 리뷰 시작하겠습니다. 이 논문은 untrimmed video(편집되지 않은 영상)에서 자연어 쿼리를 통해 temporal segments를 retrieving하는…
[ICCV2017]Localizing Moments in Video with Natural Language
안녕하세요. 오늘 제가 소개할 논문은 ICCV 2017에 개재된 Localizing Moments in Video with Natural Language입니다. 비디오 태스크 중 하나인 Moment Retrieval을 최초로 다룬 논문입니다. Moment…
[ICCV2019] SlowFast Networks for Video Recognition
안녕하세요. Video task에서 backbone으로 자주 활용되는 SlowFast 모델을 리뷰하겠습니다. Motivation Artificial Neural Network 즉, 인공신경망은 생물신경망에서 영감을 받아 고안되었습니다. 물론 인공신경망과 생물신경망이 실제로 작동하는 방식은…
[CVPR2015]Learning Spatiotemporal Features with 3D Convolutional Networks
안녕하세요. 오늘 제가 리뷰할 논문은 바로 CVPR2015에 개재된 Learning Spatiotemporal Features with 3D Convolutional Networks입니다. 이 논문은 비디오 task에서 3D convolution을 제시한 모델입니다. Introduction 인터넷에서의…
2023년을 마무리하며 – 박성준
안녕하세요 박성준입니다. 어느새 시간이 흘러 2023년이 지나가고 2024년이 되었네요. URP를 진행하며 연구자의 길을 걷기로 결정하고 연구실에 들어온 것이 엊그제 같은데, 벌써 2024년이라니 감회가 새롭네요. 2023년을…
[NIPS 2014] Generative Adversarial Nets
안녕하세요 오늘은 생성형 모델로 유명한 GAN입니다. GAN이 어떻게 이미지를 생성해낼 수 있는지 왜 기존의 생성형 모델들이 아닌 GAN에 사람들이 관심을 갖게 되었는지 논문 리뷰를 통해…
[CVPR2016]Deep Residual Learning for Image Recognition
안녕하세요 오늘의 X-Review는 ResNet입니다. ResNet은 2015년도 ImageNet Classification 대회인 ILSVRC 대회에서 1등을 차지하고 현재까지 backbone모델로 많이 사용되는 모델입니다. 다들 익숙하신 내용이겠지만 CNN과 VGG모델을 알고 있다는…
최신 댓글