[월:] 2024년 08월
[NIPS2023]CAST: Cross-Attention in Space and Time for Video Action Recognition
안녕하세요. 박성준입니다. 오늘 제가 할 리뷰는 KCCV 2024 포스터 및 오랄 발표 논문으로 video understanding 연구를 진행한 CAST 논문입니다. 먼저 Video Action Recognition는 영상 내…
[ICCV 2023] Open-Vocabulary Video Question Answering: A New Benchmark for Evaluating the Generalizability of Video Question Answering Models
안녕하세요, 마흔두 번째 X-Review입니다. 이번 논문은 2023년도 ICCV에 게재된 Open-Vocabulary Video Question Answering: A New Benchmark for Evaluating the Generalizability of Video Question Answering Model로…
[NIPS 2023] Understanding the latent space of diffusion models through the lens of riemannian geometry
안녕하세요, 정의철 연구원입니다. 이번에 소개할 논문은 지난번 KCCV 학회에 참관했을 때 포스터 세션에서 접하게 된 논문인데, 제목은 ‘Latent Space Geometry in Diffusion Models’입니다. 이 논문은…
[2024-하계][한상준] URP를 마치며
[소개] 안녕하세요. 2024년 URP 하계과정을 이수한 지능기전공학부 스마트기기공학과 20학번 한상준입니다. 인공지능 분야로 진로를 잡기 위해서는 대학원을 나와야지만 가능하다는 말을 들어보셨을 것입니다. 마찬가지로 저도 인공지능에 관심을…
[2024-하계][최열음] URP를 마치며
RCV 2024년 Summer URP를 마치며. 2달간의 URP를 마치게 되었습니다. 이 글을 읽고 계시다면 분명 URP에 관심을 갖고 계신 분일것이라 생각합니다. 다른 분들의 후기도 많이 읽어…
[2024-하계][김나연] URP를 마치며
[자기 소개] 안녕하세요, 한국외국어대학교 GBT학부 김나연입니다. 저는 타대학생으로 세종대학교 RCV URP 프로그램에 참여하게 되었습니다. 제 글이 URP 프로그램 참여를 고민하고 있는 세종대 학생분들 뿐만 아니라…
[arXiv 2024]WorldAfford: Affordance Grounding based on Natural Language Instructions
제가 이번에 리뷰할 논문도 affordance grounding분야의 논문입니다. 제가 이전에 리뷰했던 Affordance Grounding 관련 논문들은 action이나 대상 object에 대해 단순한 방식이나 정해진 템플릿으로 입력하여 그에 해당하는…
[ECCV 2024] BAM-DETR: Boundary-Aligned Moment Detection Transformer for Temporal Sentence Grounding in Videos
안녕하세요. 이번주 X-Review는 오랜만에 다시 비디오의 Moment Retrieval task 논문으로 돌아왔습니다. 소개해드릴 BAM-DETR이라는 논문은, 보통 Moment Retrieval과 Highlight Detection이라는 2가지 task를 동시에 수행하는 DETR 기반의…
[INTERSPEECH 2024]SELM: Enhancing Speech Emotion Recognition for Out-of-Domain Scenarios
Introduction Speech Emotion Recognition은 사람의 음성이 나타내는 감정을 인식하는 task입니다. 사람은 일반적으로 음성 대화 과정에서 다양한 감정을 표현하고 있기 때문에, 대화의 맥락을 이해하고 적절히 반응하기…
[ECCV 2024] OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation
안녕하세요, 마흔 세번째 x-review 입니다. 이번 논문은 2024년도 ECCV에 게재된 OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation 입니다. 23년도에 처음으로 3D detection에서…
최신 댓글