[ICML 2021] Learning Transferable Visual Models From Natural Language Supervision (CLIP) – Part 1
이런 분들께 이 논문을 추천드립니다. CLIP이 도대체 뭔지 궁굼하신 분 Multi-modal Joint Embedding에 관심이 있으신 분 27 페이지에 달하는 이 논문을 읽을 엄두가 안 나시는…
[KCCV 2023] 학회 참관기
네 안녕하세요. KCCV 학회 참관 후기를 작성하도록 하겠습니다. 1. 두번째 KCCV 참석 작년 KCCV에 이어 이번이 두번째 KCCV 학회 참석입니다. 작년 학회때는 oral session, poster…
KCCV 2023 참관기
제가 이번에 작성할 내용은 KCCV 2023 참관기입니다. 2021년에 온라인으로 KCCV에 참여하였는데, 그때 당시에도 새로운 분야에 대해 알게 되어 흥미로웠는데, 이번에도 새로운 분야들을 많이 알게 되었습니다….
[KCCV 2023] 학회 참관기
안녕하세요. 이번주 참석했던 KCCV 학회의 참관기를 글로 남겨보고자 합니다. 우선 오프라인 학회는 3일 간 오전 10시부터 오후 6시까지 진행되었고, 그 중 3시 반까지는 국제학회 논문을…
KCCV 2023 참관기
안녕하세요. 이번에는 KCCV 2023 참관기에 대해서 작성해보자 합니다. <첫 느낌> KCCV에 대해서 가장 첫번째 느낀 점은 KCCV가 이전에 제가 참가했던 학회와 다른 성향의 학회 였다는…
[AAAI 2020] M3ER: Multiplicative Multimodal Emotion Recognition using Facial, Textual, and Speech Cues
Introduction 여느 논문처럼 감정인식 task의 중요성을 언급하는 것으로 시작하는데요, human-interactive에는 감정인식이 중요하며, 인간이 다른 사람의 감정을 유추할 때 그 사람의 표정, 말투, 행동 등을 종합적으로…
[ICCV 2021] Group-Free Object Detection via Transformers
안녕하세요, 열번째 x-review 입니다. 이번 논문은 ICCV 2021에 게재된 Group-Free Object Detection via Transformers라는 논문으로 3D 데이터인 포인트 클라우드로 기존의 그룹화를 하지 않고 detection이 가능한…
[AAAI-2020] Real-time Scene Text Detection with Differentiable Binarization
안녕하세요. 열 번째 X-Review입니다. 금주 리뷰할 논문은 AAAI 2020에 게재된 <Real-time Scene Text Detection with Differentiable Binarization>입니다. 본 논문 저자는 지지난번 리뷰했던 Mask TextSpotter 논문의…
[CVPR 2023] Localized Semantic Feature Mixers for Efficient Pedestrian Detection in Autonomous Driving
안녕하세요. 열 여덟번째 x-review입니다. 이번에 리뷰할 논문은 올해 CVPR에 게재된 pedestrian detection 논문으로, 2D pedestrian detection과 관련하여 3-4편 가량의 논문 중 한 편입니다. 본 논문의…
[CVPR2023] PiMAE:Point Cloud and Image Interactive Masked Autoencoders for 3D Object Detection
Masked autoencoder는 시각적인 표현력을 잘 학습할 수 있어 몇몇의 독립적인 modality에서 좋을 결과를 보였지만 multi-modal의 경우 많이 적용이 되지 못했다. 본 논문에서는 point cloud와 rgb…
안녕하세요, 리뷰 읽어주셔서 감사합니다.. 논문에서 text로 얻는 평균과 분산은 텍스트에 적합한 다양한 장면들의 분포를 나타내는 prior 역할을 하게 됩니다. 그런데…