[카테고리:] Paper

Paper Review

Posted in Paper X-Review

[ICLR 2021] AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

안녕하세요. 백지오입니다. 일곱 번째 X-REVIEW는 그 유명한 Vision Transformer (ViT)를 소개한 논문입니다.2017년 등장한 트랜스포머는 자연어 처리 분야에서 그야말로 혜성처럼 등장해 수많은 task들을 정복해나갔습니다. 트랜스포머의 강점은…

Continue Reading
Posted in Paper X-Review

[ICCV2021]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

안녕하세요 ! 네 번째 x-review입니다. 바로 시작하겠습니다. 😔 Introduction nlp에서 사용되는 transformer를 computer vision에 적용한다면 image와 text 두 modality 차이로 다음의 두 가지 challenge가 존재합니다….

Continue Reading
Posted in Paper X-Review

[CVPR 2018] VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection

안녕하세요 ! 4번째 x-review 역시 3D Data를 다루는 논문을 읽어보았습니다. 그럼 바로 리뷰 시작하겠습니다. 1. Introduction 3D Object Detection에서는 LiDAR 센서를 통해 2D 이미지와 다르게…

Continue Reading
Posted in Paper X-Review

[T-ITS 2023] NIRPed: A Novel Benchmark for Nighttime Pedestrian and Its Distance Joint Detection

안녕하세요. 열 네번째 X-Review입니다. 본 논문은 이전 김지원 연구원님이 테크관련공유에 공유해주신 내용으로 페이스북의 AI Robotics KR 페이지를 보다 우연히 작성하신 글을 보아 시간 날 때…

Continue Reading
Posted in Paper X-Review

[CVPR2023]Divide and Adapt: Active Domain Adaptation via Customized Learning

INTRO 본 논문은 Domain adaptation 문제를 효율적으로 해결하기 위해 Active Learning 을 적용한 논문이다. Domain adaptation이란 어떤 테스크 A에 대해서 특정 도메인으로 학습된 모델을 같은…

Continue Reading
Posted in Paper X-Review

[ICCV 2019] Boundary-Matching Network for Temporal Action Proposal Generation

안녕하세요. 백지오입니다. 여섯 번째 X-Review는 Temporal Action Detection 논문인 Boundary-Matching Network를 준비하였습니다.이 논문은 저희 팀 기초 교육 과정에 읽은 논문인데, Action Detection 분야에서도 특히 Proposal…

Continue Reading
Posted in Paper X-Review

[CVPR 2021] GDR-Net: Geometry-Guided Direct Regression Network for Monocular 6D Object Pose Estimation

안녕하세요, 양희진입니다. 이번에도 베이스라인을 위해 6D Pose Estimation에 관련된 논문을 리뷰해봤습니다. 최근 BOP 챌린지에서는 GDR-Net++이 우수한 성능을 달성한 이력이 있어 먼저 이전 논문인 GDR-Net을 읽게…

Continue Reading
Posted in Paper X-Review

[CVPR2023]Siamese Image Modeling for Self-Supervised Vision Representation Learning

소개 최근 Self-supervised Learning(SSL) 분야는 다양한 비전분야의 응용문제(downstream vision tasks)에서 좋은 퍼포먼스를 보이고 있다. 현재 SSL분야는 크게 두 가지 접근법으로 발전하고 있다: Instance Discrimination(ID), Masked…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] Proposal-based Multiple Instance Learning for Weakly-Supervised Temporal Action Localization

안녕하세요, 이번 주차 X-Review에서 제가 소개해드릴 논문은 올해 CVPR에 게재된 <Proposal-based Multiple Instance Learning for Weakly-Supervised Temporal Action Localization>입니다. 본 논문은 비디오 분야에서 Weakly-supervised Temporal…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] Modeling Video as Stochastic Process for Fine-Grained Video Representation Learning

Before Review Stochastic Process라고 해서 시간이 변함에 따라 확률 변수가 어떻게 변하는 지를 모델링하는 수학적 방법이 있는데 이를 Video Representation Learning에 도입한 논문입니다. CVPR 2023…

Continue Reading