[일:] 2024년 02월 26일
[CVPR 2020] What Makes Training Multi-modal Classification Networks Hard?
안녕하세요! 이번에도 multimodal 관련 논문을 들고 왔는데요. 제목이 굉장히 흥미가 돋지 않습니까? 그래서 리뷰하고자 하였습니다. 그럼 리뷰 시작합니다! <Abstract> 본 논문에서는 multimodal 성능이 un-modal 성능에…
[2024-동계][이재찬] URP를 마치며
[소개] 안녕하세요. 저는 2024 동계 URP를 이수한 지능기전공학부 무인이동체공학과 19학번 이재찬입니다. 이 글을 읽고 계시는 분은 우선 URP 프로그램이 어떤 식으로 굴러갈 지 궁금하시거나, 혹은…
[2024-동계][최준서] URP를 마치며
안녕하세요 24동계 urp에 참여한 컴퓨터공학과 21학번 최준서입니다 지원동기 작년 저는 인공지능 대학원을 가기 위해 23년에 편입학 한 상태였습니다. 그래서 개강 이후 연구실 설명회나 김박사넷 커뮤니티…
[2024-동계][조현석] URP를 마치며
안녕하세요, 저는 2024 동계 RCV연구실 URP프로그램에 참가한 기계공학과&무인이동체공학과 18학번 조현석입니다. URP프로그램 지원을 고민하시는 분들께 제가 프로그램을 하며 경험한 것과 느낀 점들을 공유하려고 합니다. 선택에 도움이…
[2024-동계][김영규] URP를 마치며
안녕하세요, 무인이동체공학과 4학년 재학중인 19학번 김영규 입니다. 저는 1학년, 2학년은 학교에 다니면서 아무것도 한 것이 없는 사람이었습니다. (말만 이렇게 하고 열심히 하는 사람들도 있지만 2점대…
[ICCV2023]UnLoc: A Unified Framework for Video Localization Tasks
안녕하세요 오늘은 또 다른 moment retrieval 논문입니다. trimmed video을 다루는 tasks에서는 CLIP과 같은 image-text 사전 학습 모델을 활용하는 연구가 많이 진행되고 있습니다. 하지만, untrimmed video를…
[ICCV 2021] MDETR – Modulated Detection for End-to-End Multi-Modal Understanding
안녕하세요. 논문 리비전 이후 몇몇 업무들을 마친 이후, 한숨을 돌리고 3월 석사의 시작과 동시에 관심 분야의 OWOD에 대한 이해를 위한 논문 읽기에 열을 올릴 예정입니다….
[PR-L 2023] Jigsaw-ViT: Learning jigsaw puzzles in vision transformer
안녕하세요, 허재연입니다. 오늘은 Representation Learning 논문을 들고 왔습니다. 사실 representation learning이라 함은 pretext task나 adversarial learning, contrastive learning 등 사전학습을 거쳐서 모델이 데이터에 대한 일반적인…
[3DV 2021] RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching
안녕하세요, 스물네 번째 X-Review입니다. 이번 논문은 2021년도 3DV에게재된 RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching 논문으로 Optical flow 방법론인 RAFT의 stereo matching 버전입니다. 그럼…
최신 댓글