[박성준] 2024년을 마무리하며
안녕하세요. 시간이 흘러 어느새 2024년이 가고 2025년이 오고 있습니다. 올해는 저한테 있어서 배우는 점이 많았던 해인 것 같습니다. 2024년을 시작했던 다짐들을 돌아보고 앞으로 다가올 2025년의…
[권석준] 2024년 마무리, 그리고 앞으로의 고민
벌써 석사 1학년이 마무리되어갑니다. 제 앞으로의 방향성에 대해 고민과 걱정이 이만저만이 아닌 지금, 저의 2024년을 마무리 하는 글을 작성해보고자 합니다. 우선 2024년 하반기를 간단하게 돌아보고,…
[이상인] 2024년을 보내며
안녕하세요. 매년을 마무리하며 또는 상반기를 마무리하는 회고를 작성하였는데, 이제는 석사 1년 차를 마치는 2024년이 되었네요. 이번 상-하반기부터 집중하는 논문이 있기에, 오히려 예전부터 늘 해오던 고민이…
[이승현] 2024년을 돌아보며
안녕하세요. 벌써 2024년이 거의 끝나갑니다. 올해는 저에게 있어 많은 변화가 있던 해가 아닐까 합니다. 먼저 2024년을 맞이하며 했던 다짐을 살펴보고 올 한 해를 어떻게 보냈는지와…
[김태주] 2024년을 마무리하며
격변과 적응의 시기올해는 저에게 격변과 적응의 시기였습니다.아실 분들은 아시겠지만, 올해 제 메인 연구 주제를 변경하였습니다. 이전까지는 무인화 플랫폼을 타겟으로 시각 강인성을 가진 인지 알고리즘 개발을…
[CVPR 2023] DeCo: Decomposition and Reconstruction for Compositional Temporal Grounding via Coarse-to-Fine Contrastive Ranking
안녕하세요. 이번 주 X-Review에서는 23년도 CVPR에 게재된 Moment Retrieval 관련 논문 <DeCo: Decomposition and Reconstruction for Compositional Temporal Grounding via Coarse-to-Fine Contrastive Ranking>을 소개해드리겠습니다. 논문의…
[arXiv 2024] Open Vocabulary Monocular 3D Object Detection
안녕하세요, 마흔 아홉번째 x-review 입니다. 이번 논문은 한 2주 전 arXiv에 게재된 OV3D 논문으로, 지난주와 마찬가지로 monocular ov 3D 논문 입니다. CVPR 포맷으로 작성되어 있긴…
[arXiv 2024] LLM-Optic: Unveiling the Capabilities of Large Language Models for Universal Visual Grounding
안녕하세요. 제가 학부 패턴인식 수업에서 프로젝트를 진행하는 데, 그것에 대한 작은 주제로 MLLM(Multimodal LLM)을 활용한 zero-shot Visual Grounding을 시도해보고 있었습니다. 원래 처음엔 단순히 gpt4o에 모호한…
[CVPR 2022] Incorporating Semi-Supervised and Positive-Unlabeled Learning for Boosting Full Reference Image Quality Assessment
안녕하세요. 박성준 연구원입니다. 오늘은 약간 색다른 task의 논문을 리뷰하게 되었습니다. 그렇기 때문에 이번 리뷰는 좀 더 자세하게 서술해보려 합니다. 최근 unlabeled 데이터들을 잘 활용하는 방법에…
[arXiv 2024] PAVLM: Advancing Point Cloud based Affordance Understanding Via Vision-Language Model
안녕하세요. 제가 이번에 리뷰할 논문은 올해 10월에 공개된 논문입니다. 최근 affordance 관련 연구들을 리뷰하였는데, 이번에 리뷰할 논문은 3D point cloud에서의 Affordance 영역을 찾는 논문이라 읽어보게…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…