[CVPR2022]Target-aware Dual Adversarial Learning and a Multi-scenario Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection
오늘 리뷰 논문은 김지원 연구원이 슬랙-테크에 소개해준 논문이기도 하며, 다양한 환경(day/night, overcast, smoggy, strong light etc.)에서 촬영된 멀티스펙트럴 데이터 셋과 detection을 위한 visible-infrared fusion model을…
[2021 ICRA] Rapid Pose Label Generation through Sparse Representation of Unknown Objects
이번에 제가 소개할 논문은 2021 ICRA에 나온 논문으로 6DoF pose estimation을 위해 취득한 데이터셋에서 6D pose를 빠르게 라벨링하는 방법에 관한 논문입니다. 일반적으로 6DoF Pose를 라벨링하는…
[CVPR2019]Pseudo-Lidar from Visual Depth Estimation : Bridging the Gap in 3D Object Detection for Autonomous Driving
이번에 리뷰할 논문은 3D Detection에 관심있는 사람이라면 모두 다 알법한 Pseudo-Lidar 입니다. 다른 3D object detection 논문 리뷰에서 Pseudo-Lidar에 대한 언급은 많이 나오는 반면에 정작…
저널 작성기 (IEEE Access)
이번에 IEEE Access에 게재 승인된 저희 논문 “Exploring the Temporal Cues to Enhance Video Retrieval on Standardized CDVA”의 후기를 작성하고자 합니다. Publish된 제 논문을 갖기까지…
저널 작성기 (IEEE Access)
겨울 방학때 작성 했던 IEEE Access 저널 페이퍼가 이번에 Accept이 되어 이러한 작성기를 남기려고 합니다. 우선 논문의 전체적인 방향을 잡아주고, 주도적인 라이팅을 담당한 조원 연구원에게…
[ICCV-2021] Cross-category Video Highlight Detection via Set-based Learning
오늘은 지난번에 가져왔던 video highlight 논문을 또 가져왔습니다. 이 논문은 지난번 논문에서 가장 큰 문제로 지적되는 도메인에 종속된다는 문제점을 해결하기 위해 Knowledge distilation을 가져왔습니다. 그래도…
[arXiv 2022] Disentangled Representation Learning for Text-Video Retrieval
현재 Text-to-video retrieval 에서 SOTA 를 달성하고 있는 논문입니다. 중국의 유명한 인터넷 플랫폼 서비스 기업인 ‘alibaba’에 속한 인공지능 연구기관 ‘DAMO academy’에서 나온 논문이에요. 리뷰 시작하도록…
[3DV2022]Channel-Wise Attention-Based Network for Self-Supervised Monocular Depth Estimation
어김없이 돌아온 저의 Self-supervised depth estimation 논문리뷰가 되겠습니다. 이 논문 또한 3DV 논문이며 저희 논문의 비교군중 하나라 생각하시면 됩니다. 이 논문은 저희 논문과 유사한 면이…
[NeurIPS 2020] Unsupervised Learning of Visual Features by Contrasting Cluster Assignments
저는 이번에도 Self-supervised learning 논문에 대해 리뷰해보려고 합니다. 벌써 4주 연속으로 리뷰를 self-supervised learning 중에서도 contrastive loss를 사용한 논문에 대해서만 리뷰하는 것 같네요. 다음주부터는 조금…
LabelFusion: A Pipeline for Generating Ground Truth Labels for Real RGBD Data of Cluttered Scenes
안녕하세요 이번에 제가 다루게된 논문은 LabelFusion이라고 불리는 논문입니다. 해당 논문은 3D 라벨링을 하는 파이프라인을 다룬 논문 2018년 ICRA에 발표된 논문입니다. 가동원전 데이터셋 촬영에 대한 고민을…
좋은 질문 감사합니다. 말씀해주신 대로, DiscoVLA는 멀티모달 LLM인 LLaVA-NeXT를 활용해 프레임별 pseudo-caption을 생성하고 이를 정렬 학습에 활용하였습니다. 다만, 이 pseudo-caption의…