Author: 박 성준

Posted in X-Review

[AAAI2019]Multilevel Language and Vision Integration for Text-to-Clip Retrieval

안녕하세요. 오늘은 moment retrieval (video temporal grounding) task를 다룬 논문입니다. 바로 리뷰 시작하겠습니다. 이 논문은 untrimmed video(편집되지 않은 영상)에서 자연어 쿼리를 통해 temporal segments를 retrieving하는…

Continue Reading
Posted in X-Review

[ICCV2017]Localizing Moments in Video with Natural Language

안녕하세요. 오늘 제가 소개할 논문은 ICCV 2017에 개재된 Localizing Moments in Video with Natural Language입니다. 비디오 태스크 중 하나인 Moment Retrieval을 최초로 다룬 논문입니다. Moment…

Continue Reading
Posted in X-Review

[ICCV2019] SlowFast Networks for Video Recognition

안녕하세요. Video task에서 backbone으로 자주 활용되는 SlowFast 모델을 리뷰하겠습니다. Motivation Artificial Neural Network 즉, 인공신경망은 생물신경망에서 영감을 받아 고안되었습니다. 물론 인공신경망과 생물신경망이 실제로 작동하는 방식은…

Continue Reading
Posted in X-Review

[CVPR2015]Learning Spatiotemporal Features with 3D Convolutional Networks

안녕하세요. 오늘 제가 리뷰할 논문은 바로 CVPR2015에 개재된 Learning Spatiotemporal Features with 3D Convolutional Networks입니다. 이 논문은 비디오 task에서 3D convolution을 제시한 모델입니다. Introduction 인터넷에서의…

Continue Reading
Posted in X-Diary

2023년을 마무리하며 – 박성준

안녕하세요 박성준입니다. 어느새 시간이 흘러 2023년이 지나가고 2024년이 되었네요. URP를 진행하며 연구자의 길을 걷기로 결정하고 연구실에 들어온 것이 엊그제 같은데, 벌써 2024년이라니 감회가 새롭네요. 2023년을…

Continue Reading
Posted in X-Review

[NIPS 2014] Generative Adversarial Nets

안녕하세요 오늘은 생성형 모델로 유명한 GAN입니다. GAN이 어떻게 이미지를 생성해낼 수 있는지 왜 기존의 생성형 모델들이 아닌 GAN에 사람들이 관심을 갖게 되었는지 논문 리뷰를 통해…

Continue Reading
Posted in X-Review

[CVPR2016]Deep Residual Learning for Image Recognition

안녕하세요 오늘의 X-Review는 ResNet입니다. ResNet은 2015년도 ImageNet Classification 대회인 ILSVRC 대회에서 1등을 차지하고 현재까지 backbone모델로 많이 사용되는 모델입니다. 다들 익숙하신 내용이겠지만 CNN과 VGG모델을 알고 있다는…

Continue Reading
Posted in X-Review

딥러닝 기초

안녕하세요. 제가 처음으로 쓰는 X-Review의 주제는 딥러닝의 기초입니다. 기초 교육을 받으며 공부한 내용을 정리하여 작성하겠습니다. 신경망이란 인간은 뉴런이라고 하는 인간의 뇌세포로 복잡하게 연결된 네트워크를 형성하고,…

Continue Reading