[일:] 2024년 07월 21일

Posted in Paper X-Review

[ACM MM 2022] Reading and Writing: Discriminative and Generative Modeling for Self-Supervised Text Recognition

안녕하세요, 마흔 번째 X-Review입니다. 이번 논문은 2022년도 ACM MM에 게재된 Reading and Writing: Discriminative and Generative Modeling for Self-Supervised Text Recognition입니다. 바로 시작하도록 하겠습니다. 😵…

Continue Reading
Posted in Conference X-Review

[CVPR 2024]Open-vocabulary object 6D pose estimation

제가 이번에 리뷰할 6D Pose Estimation 논문도 보다 범용적으로 물체의 자세 정보를 추정하기 위한 연구로, 텍스트 프롬프트가 주어졌을 때 이에 대응되는 관심 객체의 자세정보를 추정하는…

Continue Reading
Posted in Paper X-Review

[CVPR 2024] Enhancing Multimodal Cooperation via Sample-level Modality Valuation

pdf code & dataset [2024.07.31 2.2 파트 설명 추가] 저는 현재 multimodal imbalance, multimodal bias와 관련하여 이를 해결하는 방법론을 제안하는 논문을 작성 중에 있습니다. 그런데…

Continue Reading
Posted in Paper X-Review

[NeurIPS 2023 Spotlight] 3D-LLM: Injecting the 3D World into Large Language Models

안녕하세요, 마흔번째 x-review 입니다. 이번 논문은 2023년도 NeurIPS에 Spotlight 게재된 3D-LLM: Injecting the 3D World into Large Language Models입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1….

Continue Reading
Posted in Paper X-Review

[arXiv 2023] LLM4VG: Large Language Models Evaluation for Video Grounding

안녕하세요, 이번 주 X-Review에서는 23년도 말 arXiv에 게재된 <LLM4VG: Large Language Models Evaluation for Video Grounding> 이라는 논문을 소개해드리겠습니다. 방법론 논문은 아니고, 현존하는 LLM과 Multi-modal…

Continue Reading