Skip to content

Robotics and Computer Vision Lab

AI in Sensing, AI in Perception, AI in Action

  • About
    • History
    • Photo
    • Admission
  • Members
  • Publications
    • Patents
  • X-Review
  • X-Diary
  • Peer Review

Profile

손 건화

About Posts
[arXiv 2025] DepthMaster: Taming Diffusion Models for Monocular Depth Estimation
  • Posted on: 04/06/2025 –
  • Comments: 6 Comments
[arXiv 2024] SteeredMarigold: Steering Diffusion Towards Depth Completion of Largely Incomplete Depth Maps
  • Posted on: 03/23/2025 –
  • Comments: 4 Comments
[RA-L 2025] MonoTher-Depth: Enhancing Thermal Depth Estimation via Confidence-Aware Distillation
  • Posted on: 03/16/2025 –
  • Comments: 4 Comments
[CoRL 2024] D3RoMA: Disparity Diffusion-based Depth Sensing for Material-Agnostic Robotic Manipulation
  • Posted on: 03/09/2025 –
  • Comments: 2 Comments
[AAAI 2025] Zero-shot Depth Completion via Test-time Alignment with Affine-invariant Depth Prior
  • Posted on: 03/03/2025 –
  • Comments: 6 Comments
[arXiv 2025] Marigold-DC: Zero-Shot Monocular Depth Completion with Guided Diffusion
  • Posted on: 02/23/2025 –
  • Comments: 4 Comments
[CVPR 2024(oral)] Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation
  • Posted on: 02/16/2025 –
  • Comments: 8 Comments
[NeurIPS 2024] SAM-Guided Masked Token Prediction for 3D Scene Understanding
  • Posted on: 02/09/2025 –
  • Comments: 2 Comments
[arXiv 2024] Segment Anything with Multiple Modalities
  • Posted on: 02/02/2025 –
  • Comments: 4 Comments
[arXiv 2024] Are Vision-Language Models Truly Understanding Multi-vision Sensor?
  • Posted on: 01/12/2025 –
  • Comments: 10 Comments
Newer Posts 1 2 3 … 7 8 Older Posts

Conference Deadline

NEW POST

  • [CVPR2025] Masking meets Supervision: A Strong Learning Alliance
  • [CVPR 2024] PromptAD: Learning Prompts with only Normal Samples for Few-Shot Anomaly Detection
  • [ICRA 2024] Universal Visual Decomposer: Long-Horizon Manipulation Made Easy
  • [CVPR 2025] DiscoVLA: Discrepancy Reduction in Vision, Language, and Alignment for Parameter-Efficient Video-Text Retrieval
  • [WACV 2024] DTrOCR: Decoder-only Transformer for Optical Character Recognition

New Comment

  1. 류 지연 on [WACV 2024] DTrOCR: Decoder-only Transformer for Optical Character Recognition07/01/2025

    안녕하세요 질문 남겨주셔서 감사합니다 논문에서는 CTR 데이터에 대한 결과와 비교하면서 STR의 경우 이미지 내 텍스트가 갖는 특징 자체가 보다 덜…

  2. 신 인택 on [CVPR2025] Masking meets Supervision: A Strong Learning Alliance07/01/2025

    안녕하세요 정민님 깔끔한 리뷰 감사합니다. 말씀하신 것처럼 약간 지도학습기반으로 다시 회귀하는 점이 장점이자 단점이라고 생각할 수 있을 것 같습니다. 제가…

  3. 이 상인 on [arXiv 2025] [CLS] Attention is All You Need for Training-Free Visual Token Pruning: Make VLM Inference Faster06/30/2025

    안녕하세요. 리뷰 읽어주셔서 감사합니다. 아, 네 제가 여태 몇 번 리뷰와 세미나를 이 주제로 하며 새로운 Pruning 전략이 아니면 짚고…

  4. 이 상인 on [arXiv 2025] [CLS] Attention is All You Need for Training-Free Visual Token Pruning: Make VLM Inference Faster06/30/2025

    안녕하세요. 리뷰 읽어주셔서 감사합니다. 제 생각컨데, 데이터셋 기반의 분석에 편향등의 오류가 분명 있을 수 있습니다. 또, 아래 주영님의 질문처럼 특정…

  5. 이 상인 on [arXiv 2025] [CLS] Attention is All You Need for Training-Free Visual Token Pruning: Make VLM Inference Faster06/30/2025

    안녕하세요. 리뷰 읽어주셔서 감사합니다. 우선, 질문에 대해 전적으로 동의합니다. 저도 Task-specific relevance라는 점을 대응하기 위해서는 Text-relevance해야한다고 생각합니다. 우선 현재의 벤치마킹은…

  • Sign-in
  • RCV-Calendar
  • RCV-Github
  • Paper R/W
    • Arxiv
    • Deadline
    • Overleaf
  • Coding
    • OnlineJudge
    • Kaggle

포기하지 않는 강한 집념 만이 작은 차이를 만든다.

Design by SejongRCV