[ICLR2023] VisionTransformer Adapter for Dense Prediction
이번에 소개드릴 논문은 VisionAdapter라는 논문입니다. 방법론의 컨셉 자체는 단순한 것 같은데 ViT 구조에 언제든지 붙일 수 있다보니 그 범용성이 좋고 성능 향상도 크게 올리다보니 다양한…
[ICLR 2023] GOOD: Exploring Geometric Cues for Detecting Objects in an Open World
안녕하세요. 해당 논문은 연구실에서 제출 예정인 과제의 1차년도에 사용될 방법으로, 그래서 자세히 읽어본 점도 있지만 RGB 영상에 비해 Depth 영상의 이점, 활용 방안 등을 모색해보고자…
Exploring Large Language Model (LLM) : Focusing on GPTs and LLaMAs
안녕하세요. 백지오입니다. 서른 한번째 X-REVIEW는 BERT, GPT, LLaMA를 중심으로 한 LLM 리뷰를 해보고자 합니다. 오늘날 거대 언어 모델(Large Language Models; LLM)은 기술의 최첨단부터 일반 사용자까지…
[제안서 작업 후기]
안녕하세요. 허재연입니다. 이번 2월은 한달 내내 제안서 작업에 매진했었습니다. 이전부터 제안서 작업이 힘들다고 들었었는데, 직접 해보니 (제가 메인으로 작성하지 않는데도)많이 어려웠습니다. 어떤 일들을 했고 어떤…
[CVPR 2024] Multimodal Representation Learning by Alternating Unimodal Adaptation
안녕하세요! 이번에도 멀티모달 분야의 논문을 가져와봤습니다. 이번에는 따끈따근한 CVPR 2024 논문을 가져와봤는데요. 논문이 참신하면서도 높은 성능을 달성하여서 꼼꼼히 보고자 리뷰로 작성하게 되었습니다. 그럼 리뷰 시작합니다!…
GPT(Generative Pre-trained Transformer)
안녕하세요. 박성준입니다. 최근에 Moment Retrieval에 대해 서베이를 진행하며 관련 논문을 읽던 중 비디오와 텍스트를 활용하는 task의 특성상 자연어 처리에 대한 이해가 부족해 이해가 안되는 경우가…
[CVPR 2019] Group-wise Correlation Stereo Network
안녕하세요, 스물여섯 번째 X-Review입니다. 이번 논문은 2019년도 CVPR에게재된 Group-wise Correlation Stereo Network 논문입니다. 그럼 바로 리뷰 시작하겠습니다. ⛹?♀️ 1. Introductio 스테레오 매칭이란 두 이미지 쌍간의…
[ICCV 2023] CNOS: A Strong Baseline for CAD-based Novel Object Segmentation
안녕하세요, 이번 제안서 작업을 위해 unseen object 6D pose estimation을 알아보았는데요. 서베이 중 찾은 논문 중 하나이고 이를 기반으로 계속 연구가 나아가는 것이 보이네요. 이번…
Multi-modal Prompting for Low-Shot Temporal Action Localization
Before Review 오늘은 Temporal Action Localization 논문인데 처음으로 Low/Few Shot 세팅의 논문을 읽어 보게 됐습니다. 해당 논문의 저자가 Temporal Action Localization 관련해서 좋은 연구를 많이…
제안서 참여 후기
[제안서 참여] 안녕하세요 정의철 연구원입니다. 이번에는 논문 리뷰가 아닌 X-diary로 작성하게 되었습니다. 저희 다크데이터팀은 2주 동안 기초연구실 과제 제안서를 작성했습니다. 이번 기초연구실 과제에서는 신뢰가능한 대형…
안녕하세요 질문 남겨주셔서 감사합니다 논문에서는 CTR 데이터에 대한 결과와 비교하면서 STR의 경우 이미지 내 텍스트가 갖는 특징 자체가 보다 덜…