[CVPR2022] Grounded Language-Image Pre-training(GLIP)
안녕하세요. 오늘 소개 시켜드릴 논문은 Grounded Language-Image Pre-training이란 논문으로 VLM분야의 foundation모델로 GLIP이란 모델과 학습법을 제안한 논문이 되겠습니다. 해당 논문을 읽게 된 이유는 센서과제에서 학습 때…
KCCV 2024 참관기
안녕하세요. 허재연입니다. 이번에 좋은 기회로 8월 12-14일 3일간 부산 벡스코에서 개최된 KCCV2024에 참석할 수 있었습니다. 참석할 수 있도록 도와주신 교수님 및 박화원 선생님, 그리고 학회…
[NeurIPS 2022] Multimodal Contrastive Learning with LIMoE: the Language-Image Mixture of Experts
안녕하세요. 이번 주 X-Review에서는 22년도 NeurIPS에 게재된 논문 <Multimodal Contrastive Learning with LIMoE: the Language-Image Mixture of Experts>를 소개해드리겠습니다. 본 논문은 현재 구글 딥마인드로 병합된…
KCCV 2024 참관기
KCCV 2024 (24.08.12(월) ~ 14(수), 부산 BEXCO) 예기치 못한 희진님의 KCCV불참으로 인해 좋은 기회를 이어받아 대신 KCCV2024를 참관하고 오게 되었습니다. 출발 3일 전 급하게 참관…
[CVPR 2024] AffordanceLLM: Grounding Affordance from Vision Language Models
제가 이번에 리뷰할 논문도 Affordance Grounding 논문입니다. 지난번에 리뷰한 논문은 LLM이나 VLM을 활용하지는 않고, affordance 정보를 class로만 활용하였는데, 해당 논문은 VLM을 이용하여 affordance grounding의 일반화…
KCCV 2024 참관기
안녕하세요. 오늘은 KCCV 2024 학회 참관기를 작성해보고자 합니다. 학회는 3일동안 10시부터 18시까지 진행이 되었고 크게 Oral, Keynote, Industry, Poster/Demo, Doctoral Colloquium, Panel Discussion session으로 구성되어…
KCCV 2024 참관기
안녕하세요, 이번 X-Diary는 지난 8월 12-14일 동안 다녀온 2024 KCCV 학회 참관기를 작성하고자 합니다. 이전에 두 번의 학회 참관을 하였지만, 이번 KCCV처럼 학회 전 일정을…
[CVPR 2023] CLIP the Gap: A Single Domain Generalization Approach for Object Detection
오늘 리뷰할 논문은 Single Domain Generalization (SDG) 분야의 논문입니다.일반적인 Domain Generalization 에서는 여러 source dataset을 사용하는 데에 반해, 본 SDG 분야에서는 단일 source dataset만을 사용해서…
kccv2024 참관기
안녕하세요. 이번에는 kccv 2024를 다녀온 이후의 참관기를 작성해보고자 합니다. 작성에 앞서 kccv를 참석할 수 있도록 도와주신 교수님, 화원 선생님께 감사하다는 말씀을 먼저 드립니다. kccv 참관에…
[NeurIPS 2022]Learning Debiased Classifier with Biased Committee
안녕하세요. 지난 리뷰에 이어서 학습 데이터 편향으로 발생하는 문제를 해결하는 논문을 리뷰하려 합니다. 지난 리뷰에서는 학습에 악영향을 끼치는 편향은 대체로 학습하기 쉽다는 특징을 이용하여 학습…
안녕하세요 우현님 리뷰 재밌게 읽었습니다. 뭔가 classification용 데이터셋에서 수도라벨을 만들때, MM-GDINO를 통해 만든 박스 시각화 이미지를 하나쯤 첨부했으면? 그 모델의…