Author: rcvlab
[arXiv 2023] VVS: Video-to-Video Retrieval with Irrelevant Frame Suppression
안녕하세요. 백지오입니다. 두 번째 x-review는 지난주에 이어 video retrieval 분야의 논문이자, 우리 연구실에서 작성된 논문인 VVS를 들고 왔습니다. 본격적으로 비디오팀에서 기초 교육을 받기 시작한 3월부터…
[CVPR 2018]MobileNetV2: Inverted Residuals and Linear Bottleneck
안녕하세요, 로보틱스 팀 신입 연구원 양희진이라고 합니다. 이번에 로보틱스 팀에서 제안서 작업을 진행을 했었는데 제가 할당받은 task는 경량화 모델(light-weight model)에 대해 서베이 및 작성에 대해…
A sneak peak of the Video Retrieval
안녕하세요. 백지오입니다! 드디어 첫 X-REVIEW를 작성하게 되었습니다. 기념비적인 첫 X-REVIEW로 어떤 글을 쓰면 좋을지 고민하다가, 처음부터 아주 새로운 논문에 도전하는 것보다 제가 지난 한 달간…
[CVPR 2022] Multimodal Token Fusion for Vision Transformers
기존의 vision transformer에 사용된 multiple modalities 데이터는 성능을 향상시키는데 도움이 되었지만, inner-modal의 집중해야하는 부분인 attentive weights는 충분히 고려되지 못해 최종 성능에는 좋은 영향을 주지 못했다….
[ICCV 2021]Group-Free 3D Object Detection via Transformers
irregular한 3d point cloud에서 object representation을 추출하기 위해서 기존의 방법론들은 points들을 grouping하여 object로 판단되는 각 point마다 object candidate로 할당하여 object features를 추출하였다. 하지만 hand-crafted 방식으로…
[CVPR 2022] RBGNet: Ray-based Grouping for 3D Object Detection
기존 3d object detection 방법론들에서는 object의 foreground surface geometric 정보를 충분히 사용하지 못했다. 본 논문에서는 voting방식을 기반으로 하는 RBGNet을 제안한다. 이름에서 알 수 있듯이 ray를…
[WACV 2022] ImVoxelNet: Image to Voxels Projection for Monocular and Multi-View General-Purpose 3D Object Detection
본 논문에서는 posed monocular or multi-view rgb images를 기반으로 하는 fully convolutional 3d object detection 방법론인 ImVoxelNet을 제안한다. 본 논문의 저자는 전에 읽어보았던 FCAF3D, TR3D…
[2023-동계][정윤서] URP를 마치며
소개 .. 안녕하세요. 지능기전공학부 스마트기기공학전공 20학번 정윤서입니다. 저는 고등학교 때부터 인공지능 관련 분야로 진학하기를 희망해왔고, 그 뜻에 맞게 지능기전공학부로 입학했습니다. 사실 대학교에 들어오기 전에는 인공지능…
[2023-동계][손건화] URP를 마치며
안녕하세요 저는 지능기전공학부 스마트기기공학전공 20학번 손건화 입니다. 2023년 동계 URP 프로그램을 마치고 이번 3월부터 연구실에 합류하게 되었습니다. URP 프로그램 시작 직전까지 개발과 연구 사이에서 고민해왔기…
[2023-동계][양희진] URP를 마치며
I. 소개 안녕하세요, 세종대학교 지능기전공학부 17학번 양희진이라고 합니다. 먼저, 저는 글을 잘 쓰는 편이 아니라 두서 없이 글을 작성을 하였습니다. 재밌게 봐주셨으면 합니다. 저는 편입생입니다….
안녕하세요 질문 남겨주셔서 감사합니다 논문에서는 CTR 데이터에 대한 결과와 비교하면서 STR의 경우 이미지 내 텍스트가 갖는 특징 자체가 보다 덜…