Skip to content

Robotics and Computer Vision Lab

AI in Sensing, AI in Perception, AI in Action

  • About
    • History
    • Photo
    • Admission
  • Members
  • Publications
    • Patents
  • X-Review
  • X-Diary
  • Peer Review

Profile

홍 주영

About Posts
[ICCV 2023] Audio-Enhanced Text-to-Video Retrieval using Text-Conditioned Feature Alignment
  • Posted on: 08/31/2025 –
  • Comments: 5 Comments
[ICCV 2025] DynImg: Key Frames with Visual Prompts are Good Representation for Multi-Modal Video Understanding
  • Posted on: 08/18/2025 –
  • Comments: 3 Comments
[NAACL 2025] DREAM: Improving Video-Text Retrieval Through Relevance-Based Augmentation Using Large Foundation Models
  • Posted on: 08/11/2025 –
  • Comments: 2 Comments
[ICCV 2025] Everything is a Video: Unifying Modalities through Next-Frame Prediction
  • Posted on: 07/28/2025 –
  • Comments: 8 Comments
2025년 상반기 회고문 @홍주영
  • Posted on: 07/21/2025 –
  • Comments: 2 Comments
[CVPR 2025] Language-Guided Image Tokenization for Generation
  • Posted on: 07/13/2025 –
  • Comments: 4 Comments
[ECCV 2024] KDProR: A Knowledge-Decoupling Probabilistic Framework for Video-Text Retrieval
  • Posted on: 07/07/2025 –
  • Comments: No Comments
[CVPR 2025] DiscoVLA: Discrepancy Reduction in Vision, Language, and Alignment for Parameter-Efficient Video-Text Retrieval
  • Posted on: 06/29/2025 –
  • Comments: 4 Comments
[CVPR 2025] Rethinking Noisy Video-Text Retrieval via Relation-aware Alignment
  • Posted on: 06/08/2025 –
  • Comments: 4 Comments
[CVPR 2025] MultiVENT 2.0: A Massive Multilingual Benchmark for Event-Centric Video Retrieval
  • Posted on: 05/26/2025 –
  • Comments: 6 Comments
1 2 … 10 11 Older Posts

Conference Deadline

NEW POST

  • [2023 ICCV] Unified Coarse-to-Fine Alignment for Video-Text Retrieval
  • [arxiv 2025] Vision Language Models are Biased
  • [ICCV 2025] Selective Contrastive Learning for Weakly Supervised Affordance Grounding
  • [arXiv 2025] OpenHelix: An Open-source Dual-System VLA Model for Robotic Manipulation
  • 2025년도 하계 URP 조교를 마치며

New Comment

  1. 허 재연 on [AAAI 2024] TD2-Net: Toward Denoising and Debiasing for Dynamic Scene Graph Generation09/01/2025

    저자는 noisy한 object가 학습 및 예측에 사용하는것을 방지하기 위해 필터링 목적으로 top-K 선택 연산을 도입하였습니다. 이 때 미분 불가능한 top-k…

  2. 정 의철 on [arxiv 2025] Vision Language Models are Biased09/01/2025

    안녕하세요, 유진님. 좋은 리뷰 감사합니다. 저자의 다양한 실험 결과를 보면 VLM이 사전 학습된 지식에 상당히 편향되어 있음을 확인할 수 있었습니다.…

  3. 정 의철 on [ICCV 2023] Audio-Enhanced Text-to-Video Retrieval using Text-Conditioned Feature Alignment09/01/2025

    방법론 설명에서 “비디오 임베딩과 오디오 임베딩을 텍스트 조건부로 정렬한다”는 표현이 와닿지 않아 질문드립니다. 제가 이해하기로는, 텍스트와 비디오 인코더를 통해 임베딩을…

  4. 김 태주 on [arxiv 2025] Vision Language Models are Biased09/01/2025

    재밌는 논문 리뷰 감사합니다. VLM에게도 사람과 같이 사전 지식을 토대로 편향된 지식 추론 능력을 가지고 있음을 보이는 논문이네요. 해당 점점…

  5. 김 영규 on [IEEE 2024 IJCNN]Image Caption Method from Coarse to Fine Based On Dual Encoder-Decoder Framework09/01/2025

    안녕하세요 인택님 리뷰 감사합니다. Dual encoder-decoder 구조,, 흥미롭네요. 이러한 coarse-> fine 구조가 로보틱스 쪽에서도 응용되고 있는지 궁금하네요. 혹시 이러한 구조가…

  • Sign-in
  • RCV-Calendar
  • RCV-Github
  • Paper R/W
    • Arxiv
    • Deadline
    • Overleaf
  • Coding
    • OnlineJudge
    • Kaggle

포기하지 않는 강한 집념 만이 작은 차이를 만든다.

Design by SejongRCV