[ICML 2021] Learning Transferable Visual Models From Natural Language Supervision
<1. Introduction and motivating work> raw text로부터 직접적으로 학습하는 사전학습 방법들은 지난 몇년동안 NLP 분야에서 진화되어왔습니다. standardized input-output inference으로 “text-to-text”가 발전하면서 작업에 구애받지 않는 다운스트림…
[NeurIPS 2022] CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds
본 논문에서는 two-stage의 fully sparse convolutional 3D object detection framework인 CAGroup3D를 제안한다. CAGroup3D에서는 class-aware local group 방식을 통해 object surface voxel에 대해 3d proposals를 생성하고,…
[arXiv 2017] PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes
안녕하세요, 로보틱스 팀 양희진이라고 합니다. 이번에는 6D pose estimation에 대한 논문인 PoseCNN을 리뷰 해보았습니다. 일단 PoseCNN 을 읽은 이유는 6D pose estimation에서 인용수가 꽤 많은…
[arXiv 2023] VVS: Video-to-Video Retrieval with Irrelevant Frame Suppression
안녕하세요. 백지오입니다. 두 번째 x-review는 지난주에 이어 video retrieval 분야의 논문이자, 우리 연구실에서 작성된 논문인 VVS를 들고 왔습니다. 본격적으로 비디오팀에서 기초 교육을 받기 시작한 3월부터…
[CVPR 2022] Interactive Multi-Class Tiny-Object Detection
안녕하세요. 열 한번째 X-Review입니다. CVPR 2023 Paper list를 확인해보니 Small-Object Detection을 담은 논문은 발표되지 않아 아쉬워서, QueryDet에 이어 CVPR 2022의 Tiny-Object Detection과 관련된 논문 한…
[ICLR 2018] Mixed Precision Training
Introduction 일반적으로 Neural Network의 크기가 커질수록 모델의 정확도는 상승합니다. 그러나 모델의 크기가 증가하면 그에 따른 메모리 사용량 그리고 연산량도 같이 증가하게 됩니다 본 논문에서는 모델을…
[ICCV2019] Attention Augmented Convolutional Networks
안녕하세요. 어느덧 연구실에 들어온지 2개월이 지나 x-review를 쓰게 되었네요 .. 이참에 attention에 대해 제대로 공부해보고 싶어서 attention과 관련된 논문으로 첫번째 x-review를 쓰게 되었습니다. 그럼 리뷰…
[CVPR 2018] An Analysis of Scale Invariance in Object Detection – SNIP
첫 X-review입니다 . . 원래는 다른 논문을 읽고 있었는데, 익명의 누군가가 깜!짝 놀라며 바꾸라고 조언하였기도 하고 처음이기도 해서 X-review 맛보기로 좀 쉽고 가벼운 논문으로 들고…
[CVPR 2018]MobileNetV2: Inverted Residuals and Linear Bottleneck
안녕하세요, 로보틱스 팀 신입 연구원 양희진이라고 합니다. 이번에 로보틱스 팀에서 제안서 작업을 진행을 했었는데 제가 할당받은 task는 경량화 모델(light-weight model)에 대해 서베이 및 작성에 대해…
[2021 NIPS] Low-Fidelity Video Encoder Optimization for Temporal Action Localization
Before Review 간만에 Temporal Action Localization 관련 논문 리뷰 입니다. NIPS에 억셉된 논문이기도 하고 논문제목에도 Optimization이라는 키워드가 있어서 뭔가 나름 ML스러운 접근으로 Action Localization을 해결한…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…