Skip to content

Robotics and Computer Vision Lab

AI in Sensing, AI in Perception, AI in Action

  • About
    • History
    • Photo
    • Admission
  • Members
  • Publications
    • Patents
  • X-Review
  • X-Diary
  • Peer Review

Profile

황 유진

About Posts
[arxiv 2025] Vision Language Models are Biased
  • Posted on: 09/01/2025 –
  • Comments: 8 Comments
[CVPRW2024]ViTA: An Efficient Video-to-Text Algorithm using VLM for RAG-based VideoAnalysis System
  • Posted on: 08/18/2025 –
  • Comments: 4 Comments
[AAAI2025] Video Repurposing from User Generated Content: A Large-scale Dataset and Benchmark
  • Posted on: 08/04/2025 –
  • Comments: 2 Comments
[arXiv2025] VideoRAG: Retrieval-Augmented Generation over Video Corpus
  • Posted on: 07/28/2025 –
  • Comments: No Comments
2025년 상반기 회고
  • Posted on: 07/21/2025 –
  • Comments: 2 Comments
[CVPR2024] Towards Automated Movie Trailer Generation
  • Posted on: 07/07/2025 –
  • Comments: 6 Comments
[CVPR2023]Causalainer: Causal Explainer for Automatic Video Summarization
  • Posted on: 06/30/2025 –
  • Comments: 2 Comments
[CVPR2023]Align and Attend: Multimodal Summarization with Dual Contrastive Losses
  • Posted on: 06/09/2025 –
  • Comments: 6 Comments
[arXiv2025]Video Summarization with Large Language Models
  • Posted on: 05/26/2025 –
  • Comments: 2 Comments
[AAAI2024]V2Xum-LLM: Cross-Modal Video Summarization with Temporal Prompt Instruction Tuning
  • Posted on: 05/19/2025 –
  • Comments: 4 Comments
1 2 … 14 15 Older Posts

Conference Deadline

NEW POST

  • [2023 ICCV] Unified Coarse-to-Fine Alignment for Video-Text Retrieval
  • [arxiv 2025] Vision Language Models are Biased
  • [ICCV 2025] Selective Contrastive Learning for Weakly Supervised Affordance Grounding
  • [arXiv 2025] OpenHelix: An Open-source Dual-System VLA Model for Robotic Manipulation
  • 2025년도 하계 URP 조교를 마치며

New Comment

  1. 허 재연 on [AAAI 2024] TD2-Net: Toward Denoising and Debiasing for Dynamic Scene Graph Generation09/01/2025

    저자는 noisy한 object가 학습 및 예측에 사용하는것을 방지하기 위해 필터링 목적으로 top-K 선택 연산을 도입하였습니다. 이 때 미분 불가능한 top-k…

  2. 정 의철 on [arxiv 2025] Vision Language Models are Biased09/01/2025

    안녕하세요, 유진님. 좋은 리뷰 감사합니다. 저자의 다양한 실험 결과를 보면 VLM이 사전 학습된 지식에 상당히 편향되어 있음을 확인할 수 있었습니다.…

  3. 정 의철 on [ICCV 2023] Audio-Enhanced Text-to-Video Retrieval using Text-Conditioned Feature Alignment09/01/2025

    방법론 설명에서 “비디오 임베딩과 오디오 임베딩을 텍스트 조건부로 정렬한다”는 표현이 와닿지 않아 질문드립니다. 제가 이해하기로는, 텍스트와 비디오 인코더를 통해 임베딩을…

  4. 김 태주 on [arxiv 2025] Vision Language Models are Biased09/01/2025

    재밌는 논문 리뷰 감사합니다. VLM에게도 사람과 같이 사전 지식을 토대로 편향된 지식 추론 능력을 가지고 있음을 보이는 논문이네요. 해당 점점…

  5. 김 영규 on [IEEE 2024 IJCNN]Image Caption Method from Coarse to Fine Based On Dual Encoder-Decoder Framework09/01/2025

    안녕하세요 인택님 리뷰 감사합니다. Dual encoder-decoder 구조,, 흥미롭네요. 이러한 coarse-> fine 구조가 로보틱스 쪽에서도 응용되고 있는지 궁금하네요. 혹시 이러한 구조가…

  • Sign-in
  • RCV-Calendar
  • RCV-Github
  • Paper R/W
    • Arxiv
    • Deadline
    • Overleaf
  • Coding
    • OnlineJudge
    • Kaggle

포기하지 않는 강한 집념 만이 작은 차이를 만든다.

Design by SejongRCV